急招
远程
全职
发布于 2024-11-09
可观测平台架构师
5000-8000U/月
remote
LBank
DeFi · 500-1000 人
要求:可观测性OpenTelemetryVictoriaMetricsVictoriaLogsHBase
职位描述
要求:可观测性、OpenTelemetry、VictoriaMetrics、VictoriaLogs、HBase
工作职责:
1、负责可观测平台和故障分析系统的设计和开发工作,负责核心功能代码编写
2、解决随着业务增长带来的高并发、海量数据实时处理的各种技术挑战,持续优化系统,增强系统稳定性,保障系统的高可用。
3、基于海量异常数据全局分析、相关性根因分析、多维度指标数据异常检测、智能告警等;及时发现与定位工程问题。
4、参与或者主导过监控或可观测平台建设,对相关技术(如Prometheus,VictoriaMetrics,VMAgent,Thanos)较深研究并且了解相关原理
5、参与或主导过可观测(Metrics、Trace、Alert、Event)平台的研发、落地、推广
职位要求
岗位要求:
1、具有8年以上工作经验;精通1-2门主流程序设计语言,golang、java优先,具备扎实的编程基本;
2、参与或者主导过监控或可观测平台建设,对相关技术(如Prometheus,VictoriaMetrics,VictoriaLogs,VMAgent,Thanos)较深研究并且了解相关原理
2、具备扎实的计算机基础,对常见的数据结构和算法、索引、列式存储方式、压缩算法有较为深刻的理解;
3、具有分布式大中型系统的架构设计经验,有大规模数据采集、处理、存储经验者优先;
4、熟悉服务端相关技术,对MySQL、Redis、Kafka、ES、ClickHouse、TSDB、ELK、Grafana 等技术了解原理并有丰富的使用经验(至少熟练掌握3个);
5、熟悉监控领域相关技术或产品,如 Prometheus,Grafana,Zipkin,OpenTelemetry,Zabbix 等
6、熟悉数据处理相关技术或产品,如 Flink,Spark,HBase,ElasticSearch 等
7、对Tracing链路、Metrics指标、Log日志、异常检测、根因分析领域等不同可观测数据的统一存储、统一分析引擎成本、性能、深刻理解者优先;
8、具备良好的表达和沟通能力,乐于接受有挑战性的工作,具备极强的团队合作精神,乐于分享。
加分项
1、熟悉主流开源的异常分析系统优先,如 Cat、Prometheus等。
2、参与或主导过可观测(Metrics、Trace、Alert、Event)系统的研发&落地
3、熟悉流式计算,OLAP,有Spark/Flink的开发经验尤佳
4、对时序数据库、日志引擎、多模数据库等有实际设计开发经验者优先;
福利待遇
另议