Senior Site Reliability Engineer

Zalo
Thành phố Hồ Chí Minh
Full time
1 ngày trước
Hồ Chí Minh

Full-time

As we provide services which serving million customers such as: Zalo, ZMP3, BaoMoi, Kiki ....We are looking for an experienced SRE who brings a unique perspective, a passion for collaborating with cross-functional teams, and the ability to derive real-time insights from massive-scale data to build practical solutions and deliver exceptional user experiences at every touchpoint.
  • Run the production environment by monitoring availability and taking a holistic view of system health;
  • Build software and systems to manage platform infrastructure and applications;
  • Improve reliability, quality, and time-to-market of our suite of software solutions;
  • Measure and optimize system performance, with an eye toward pushing our capabilities forward, getting ahead of customer needs, and innovating for continual improvement;
  • Provide primary operational support and engineering for multiple large-scale distributed software applications;

What you will do

  • Gather and analyze metrics from operating systems as well as applications to assist in performance tuning and fault finding;
  • Partner with development teams to improve services through rigorous testing and release procedures;
  • Participate in system design consulting, platform management, and capacity planning;
  • Create sustainable systems and services through automation and uplifts;
  • Balance feature development speed and reliability with well-defined service-level objectives

What you will need

  • Ability to program (structured and OOP) using one or more high-level languages, such as Python, Golang;
  • Experience with dynamic resource management frameworks (Kubernetes, Nomad, Yarn);
  • Experience manage infrastructure as code (Terraform,..);
  • Experience with source version control (git, svn...), as well as configuration management (Ansible, Puppet, Salt stack...);
  • Experience with distributed storage technologies such as NFS, HDFS, Ceph and Amazon S3;
  • Proactive approach to identifying problems, performance bottlenecks, and areas for improvement;

Preferred skills and qualifications
  • Previous success in technical engineering;
  • Coding experience beyond simple scripts.

Apply
Other Job Recommendations:

Senior Site Reliability Engineer

Pinnacle
Remote
  • Design, build, and maintain scalable, reliable, and secure...
  • Develop and implement CI/CD pipelines, automating...
2 tuần trước

Lead/Senior Site Reliability Engineer

Zalo
Thành phố Hồ Chí Minh
  • Build software and systems to manage platform infrastructure...
  • Measure and optimize system performance, with an eye toward...
4 tuần trước

Content & Creative Specialist

Zalo
Thành phố Hồ Chí Minh
  • Lead content planning, brand direction and creative strategy...
  • Ensure consistency in brand voice, image, and content...
2 ngày trước

Nhân Viên Hành Chính

công ty cổ phần lucky steel buildings
Thành phố Hồ Chí Minh
  • Soạn thảo, theo dõi và lưu trữ văn bản, công văn, thông báo,...
  • Quản lý tài sản, thiết bị của công ty...
1 ngày trước

Brand Communication Specialist

Công ty CPTM BOO
Hà Nội
Develop and execute a comprehensive content strategy for BOO channels (Facebook, Instagram, TikTok, etc.), including new...
2 ngày trước

Tuyển Nhân Viên Chứng Từ

THAMI SHIPPING & AIRFREIGHT CORP.
Ho Chi Minh City
6.000.000 ₫ - 23.000.000 ₫
  • Phát hành vận đơn (B/L) và các chứng từ vận tải liên quan...
  • Phối hợp chặt chẽ với bộ phận Kinh doanh (Sales) và khách...
2 ngày trước

Trợ Lý Tư Vấn Đào Tạo/ Sale

CÔNG TY CỔ PHẦN BYSCOM ACADEMY
Hà Nội
(Mức lương: Thỏa thuận) 1. Thu hút học viên tiềm năng 2. Tư vấn & chốt đơn khóa học 3. Chăm sóc học viên xuyên suốt hành trình
2 ngày trước

(Senior) Product Manager

Zalo
Thành phố Hồ Chí Minh
  • Drive the planning and review of Comm/VAS features on Zalo...
  • Collaborate closely with engineers and designers to bring...
2 ngày trước

Nhân Viên Điện Công Trình

CÔNG TY TNHH SURMAN VIỆT NAM
Hà Nội
  • Thực hiện lắp đặt, vận hành, bảo trì, sửa chữa hệ thống điện...
  • Đảm bảo an toàn và tuân thủ các quy định kỹ thuật điện trong...
1 ngày trước

Product Executive

Zalo
Thành phố Hồ Chí Minh
  • Operate and monitor the ad distribution system to ensure...
  • Investigate and troubleshoot ad delivery issues across...
1 ngày trước