SRE LÀ GÌ

4 weeks ago Prosus đồng ý sở hữu Stack Overflow với mức giá 1,8 tỷ đô la 2 months ago 30 năm thành lập và hoạt động Linux: phỏng vấn Linus Torvalds về Mã nguồn msinh hoạt cùng không dừng lại ở đó nữa – Phần 2 2 months ago 30 năm Ra đời Linux: vấn đáp Linus Torvalds về Linux cùng Git – Phần 1 2 months ago Giải ngoại hạng Anh lựa chọn cơ sở hạ tầng đám mây Oracle đến so với đá bóng 3 months ago Microsoft tải công ty công nghệ tiếng nói AI Nuance với mức giá 19,7 tỷ đô la
*
Photo: Hacker Noon

SRE (Site Reliability Engineering) là gì?

Một chuyện hết sức thường xuyên xảy ra trong những chủ thể là những đội cải tiến và phát triển (development teams) cùng team vận hành (operation teams) luôn gồm có xích míc cùng nhau. Các nhóm phát triển mong muốn thêm những tính năng mới lôi cuốn vào thành phầm. Các team quản lý mong đảm bảo rằng các nhân tài này không gây náo loạn tuyệt phá hư chương trình.

Cthị trấn này bắt đầu thay đổi vào năm 2003 Khi kỹ sư phần mềm Benjamin Treynor sáng tạo ra chuyên môn độ tin cậy của trang web (site reliability engineering- SRE) lúc thao tác tại Google. Benjamin vẫn những hiểu biết nhóm kỹ sư phần mềm của chính mình chịu trách nhiệm về một trong những trách nhiệm liên quan mang lại vận hành, tạo thành định nghĩa về SRE cùng góp giải quyết và xử lý các vấn đề thân cải tiến và phát triển cùng quản lý.

Bạn đang xem: Sre là gì

SRE hoạt động thế nào?

SRE được triển khai vày các kỹ sư độ tin cẩn trang web (site reliability engineer), còn gọi là kỹ sư độ tin cậy hình thức. Những Chuyên Viên này thường xuyên là đông đảo công ty cải tiến và phát triển phần mềm đã chiếm lĩnh một số trong những kinh nghiệm vận hành. Họ cũng hoàn toàn có thể là những chuyên gia IT tất cả các năng lực thiết kế ứng dụng.

Các nhóm SRE thiết lập cấu hình những thỏa thuận mức dịch vụ (SLA – Service Level Agreement) cho từng dịch vụ trong hệ thống. SLA xác minh độ tin tưởng quan trọng của hệ thống, góp các đội đưa ra đầy đủ kĩ năng mà họ rất có thể thực hiện.

Trong từng SLA là những chỉ số nút hình thức dịch vụ (SLI – service level indicators) với kim chỉ nam nấc hình thức dịch vụ (SLO – service level objectives).

SLI là những chỉ số tính toán một khía cạnh rõ ràng của cấp độ hình thức. Ví dụ về SLI nhưng mà chúng ta có thể ý muốn theo dõi và quan sát rất có thể là tính khả dụng, phần trăm lỗi hoặc hiệu năng của khối hệ thống.

SLO chỉ đơn giản dễ dàng là phương châm bạn muốn dành được nhằm đạt được SLI. Ví dụ: phương châm là đã đạt được được 99,8% khả dụng của một hệ thống trong suốt 1 năm.

Sự khác biệt là nút thời hạn chết. Mức thời gian hoàn thành hoạt động được điện thoại tư vấn là chi phí lỗi (error-budget), là số lỗi về tối đa cho phép vào khối hệ thống.

Bằng giải pháp thừa nhận lỗi là cần yếu tránh ngoài, sau đó bạn có thể lập chiến lược cho các lỗi, giúp đội cải tiến và phát triển xây dựng những tính năng mới tiện lợi rộng. Hãy coi, nhóm cải tiến và phát triển có thể desgin bất kỳ thiên tài làm sao họ có nhu cầu, bất cứ bao giờ người ta có nhu cầu, miễn là chúng nằm trong phạm vi ngân sách lỗi. Ngay Lúc bước ra phía bên ngoài, họ phải chịu đựng lỗi trước khi tiếp tục với những tính năng vượt trội.

Xem thêm: Phân Biệt Cách Dùng Already, Since, Just, Still Và Yet Là Thì Gì

Một phần đặc trưng trong các bước của Site Reliability Engineering là tự động hóa. Các SRE hay đề xuất tự động hóa hóa các các bước bằng tay lặp đi lặp lại, được gọi là toil (các bước nặng trĩu nhọc) , để bọn họ rất có thể triệu tập vào quá trình lâu bền hơn, đẩy cao giá trị.

Khác nhau thân DevOps với SRE

DevOps là một trong những triết lý và tập phù hợp những thực hành phối kết hợp cách tân và phát triển phần mềm với các vận động IT. Nó bao hàm năm trụ cột. Google định nghĩa những lao động chính này là:s:

Giảm tường ngăn silo trong tổ chức triển khai Chấp thừa nhận không thắng cuộc Thực hiện những đổi khác từ từ lợi thế cách thức và auto hóa Đo lường rất nhiều thứ

Nếu DevOps là Cái gì (What), thì SRE là Thế nào (How) . Nó chỉ đơn giản là 1 trong bí quyết triển khai triết lý DevOps. Trên thực tế, SRE thỏa mãn nhu cầu toàn bộ năm trụ cột của DevOps:

Giảm ngăn cản silo vào tổ chức: SRE share quyền cài đặt với những đơn vị cải cách và phát triển với họ sử dụng các khí cụ cùng chuyên môn giống như nhau. Chấp dấn thất bại: SREs định lượng thua cuộc bằng phương pháp sử dụng SLI với SLO. Họ nhận định rằng lỗi vẫn xảy ra, tuy vậy hãy đặt số lượng lỗi tối nhiều được cho phép nhằm cân đối không thắng cuộc đối với các phiên bản thành lập mới. Thực hiện tại những đổi khác dần dần dần: SRE khuyến nghị triển khai nhỏ dại rộng, lặp đi tái diễn các tính năng lạ nhằm bớt chi phí không thắng cuộc. tận dụng cơ chế với auto hóa: SREs tự động hóa hóa các tác vụ bằng tay, như sẽ nhắc sống bên trên. Đo lường phần đông thứ: SRE thực hiện số liệu (SLI) nhằm định lượng mức độ hình thức dịch vụ. Do đó, họ rất có thể giảm số lượng lỗi.

Lợi ích của SRE:

Cung cấp cho những chỉ số rõ ràng

Các chỉ số (metrics) cụ thể được cho phép các nhóm SRE nêu bật những nghành nghề dịch vụ yêu cầu nâng cao, ví dụ như sút các lỗ hổng bảo mật thông tin.

Các nhóm SRE cũng rất có thể thực hiện các số liệu nhằm tính toán thù ảnh hưởng trong các nghành khác, chẳng hạn như lợi nhuận. Ví dụ: bọn họ có thể coi bọn họ mất bao nhiêu lợi nhuận từng phút thời hạn chấm dứt vận động.

Cải thiện nay code

Các team phát triển và SRE chia sẻ và một nguồn nhân lực. Nếu nhóm cách tân và phát triển viết code kém, thì sẽ có khá nhiều nhận lực hơn cần được phân bổ cho các SRE nhằm khắc chế đều sự việc này. Và như thế, để lại không nhiều fan hơn mang đến đội phát triển.

Do kia, team cải cách và phát triển được khuyến nghị viết code xuất sắc rộng. lúc code của mình vận động tốt, họ có thể có thêm đồng chí, mang lại cho bọn họ phần lớn tài nguim cần thiết nhằm tạo ra những công dụng tốt rộng.

Giải pchờ thời hạn với tài nguyên ổn nhằm đội giá trị

Mã xuất sắc hơn, ít lỗi hơn cùng kết quả rộng tạo thành những thời hạn hơn nhằm đội giá trị đến sản phẩm. Các đơn vị cải tiến và phát triển hoàn toàn có thể tạo nên các kỹ năng giỏi hơn với thú vị hơn mà ít tạo ra sự thay rộng. Mặt không giống, team quản lý và vận hành có thể để nhiều thời gian rộng nhằm kiểm soát cùng triển khai gia hạn. Kết thích hợp số đông trang bị này lại cùng nhau cùng các bạn có một thành phầm tốt hơn cho người tiêu dùng.

Kết luận

Site Reliability Engineering đã hối hả trở nên một trong những phần cần thiết của khá nhiều công ty. SRE rất có thể giúp thu thon thả khoảng cách giữa quản lý và vận hành với cải tiến và phát triển. Do đó, bạn có thể cung ứng những áp dụng tốt hơn nhanh hao rộng nhưng ko làm cho giảm độ tin cậy của những ứng dụng kia.