急招远程全职发布于 2024-11-09

可观测平台架构师

5000-8000U/月

remote

LBank

DeFi · 500-1000 人

要求：可观测性OpenTelemetryVictoriaMetricsVictoriaLogsHBase

登录后投递加入 TG 群

职位描述

要求：可观测性、OpenTelemetry、VictoriaMetrics、VictoriaLogs、HBase 工作职责： 1、负责可观测平台和故障分析系统的设计和开发工作，负责核心功能代码编写 2、解决随着业务增长带来的高并发、海量数据实时处理的各种技术挑战，持续优化系统，增强系统稳定性，保障系统的高可用。 3、基于海量异常数据全局分析、相关性根因分析、多维度指标数据异常检测、智能告警等；及时发现与定位工程问题。 4、参与或者主导过监控或可观测平台建设，对相关技术(如Prometheus，VictoriaMetrics，VMAgent，Thanos)较深研究并且了解相关原理 5、参与或主导过可观测（Metrics、Trace、Alert、Event）平台的研发、落地、推广

职位要求

岗位要求： 1、具有8年以上工作经验；精通1-2门主流程序设计语言，golang、java优先，具备扎实的编程基本； 2、参与或者主导过监控或可观测平台建设，对相关技术(如Prometheus，VictoriaMetrics，VictoriaLogs，VMAgent，Thanos)较深研究并且了解相关原理 2、具备扎实的计算机基础，对常见的数据结构和算法、索引、列式存储方式、压缩算法有较为深刻的理解； 3、具有分布式大中型系统的架构设计经验，有大规模数据采集、处理、存储经验者优先； 4、熟悉服务端相关技术，对MySQL、Redis、Kafka、ES、ClickHouse、TSDB、ELK、Grafana 等技术了解原理并有丰富的使用经验(至少熟练掌握3个)； 5、熟悉监控领域相关技术或产品，如 Prometheus，Grafana，Zipkin，OpenTelemetry，Zabbix 等 6、熟悉数据处理相关技术或产品，如 Flink，Spark，HBase，ElasticSearch 等 7、对Tracing链路、Metrics指标、Log日志、异常检测、根因分析领域等不同可观测数据的统一存储、统一分析引擎成本、性能、深刻理解者优先； 8、具备良好的表达和沟通能力，乐于接受有挑战性的工作，具备极强的团队合作精神，乐于分享。加分项 1、熟悉主流开源的异常分析系统优先，如 Cat、Prometheus等。 2、参与或主导过可观测（Metrics、Trace、Alert、Event）系统的研发&落地 3、熟悉流式计算，OLAP，有Spark/Flink的开发经验尤佳 4、对时序数据库、日志引擎、多模数据库等有实际设计开发经验者优先；

福利待遇

另议