Sau khi viết xong mã, AI đã tiếp quản cái gì: YC W26 Cơ sở hạ tầng DevOps/Kiểm thử/Tự động hóa/Agent - Phân tích 22 công ty

Viết bài: Lăng Hàn Wei Will

Đây là bài thứ năm trong chuỗi phân tích về series YC W26. Bài trước đã phân tích các công cụ lập trình AI và “Claude Code for X” (12 công ty), còn bài này xem xét nửa còn lại của chuỗi phát triển — mọi thứ sau khi viết xong mã: vận hành, kiểm thử, tự động hóa quy trình làm việc, hạ tầng phát triển Agent, tổng cộng 22 công ty.

Mã chỉ mới là khởi đầu

Bài trước chúng ta đã nói về cách AI thay đổi “việc viết mã”. Nhưng viết mã chỉ là một phần của phát triển phần mềm — sau khi hoàn thành mã, còn có triển khai, vận hành, trực ca, kiểm thử, sửa lỗi, tự động hóa quy trình — mỗi bước đều cần con người.

22 công ty trong series W26 đang làm là: giao mọi khâu sau khi viết mã cho AI agent.

Đêm khuya 3 giờ, cảnh báo môi trường sản xuất? IncidentFox tự động kiểm tra logs, xác định nguyên nhân gốc rễ, chuẩn bị script sửa lỗi khi bạn đang ngủ, bạn chỉ cần xem xét và phê duyệt. Người dùng phát hiện lỗi? Lucent 24/7 tự động xem lại các phiên trò chuyện, phát hiện vấn đề trước người dùng. Cần tự động hóa quy trình phê duyệt trong Excel? Bubble Lab chỉ một câu đã xong.

22 công ty này có thể chia thành 4 nhóm: AI vận hành/SRE (5 công ty), AI kiểm thử/QA (2 công ty), AI tự động hóa quy trình làm việc (7 công ty), Hạ tầng phát triển Agent (8 công ty).

Kết luận trước: 4 nhận định có thể mang đi ngay

  1. IncidentFox là sản phẩm hoàn chỉnh nhất trong 22 công ty này. Hai cựu kỹ sư Roblox (hỗ trợ hạ tầng hơn 1 tỷ lượt truy cập/ngày), mã nguồn mở, hơn 300 tích hợp sẵn, triển khai trong chưa đầy 1 ngày. Điểm khác biệt chính không phải là “phân tích logs bằng AI” (ai cũng làm được), mà là “tự động phát hiện hệ sinh thái công nghệ của bạn và tự tạo tích hợp” — bỏ qua công đoạn tích hợp đau đớn nhất.

  2. AI vận hành (5 công ty) và AI kiểm thử (2 công ty) cùng làm một việc: biến “đảm bảo chất lượng mã” từ dựa vào nhân lực nặng sang dựa vào agent nhiều hơn. Vận hành truyền thống, trực ca, kiểm tra lỗi, kiểm thử hồi quy đều tốn nhiều thời gian của kỹ sư. Đặt cược của 7 công ty này là: agent có thể phát hiện vấn đề nhanh hơn, xác định nguyên nhân gốc rễ nhanh hơn, và hoạt động 24/7 không nghỉ.

  3. Tự động hóa quy trình làm việc (7 công ty) là nhóm đa dạng nhất nhưng có lượng người dùng rộng nhất. Điểm chung là “giúp người không viết mã cũng có thể dùng AI tự động hóa công việc” — RamAIn dùng thị giác máy tính thao tác bất kỳ phần mềm nào, Bubble Lab tạo quy trình tự động chỉ bằng một câu, Jinba dùng chat tự động hóa quy trình doanh nghiệp. Nhóm này không hướng tới nhà phát triển, mà hướng tới tất cả nhân viên tri thức.

  4. Hạ tầng phát triển Agent (8 công ty) là nhóm “siêu meta” — cung cấp công cụ cho người tạo agent. Emdash xây dựng môi trường phát triển agent mã nguồn mở, Overshoot làm nền tảng ứng dụng thị giác AI, Glue thiết kế giao diện agent. Logic của nhóm này giống như “hạ tầng kinh tế agent” trong bài viết về Fintech: khi số lượng agent bùng nổ, công cụ tạo agent trở thành nhu cầu thiết yếu.

Phân nhóm con 1: AI vận hành/SRE — IncidentFox, Mendral, Corelayer, Sonarly, Lucent

5 công ty làm cùng một việc nhưng ở các góc độ khác nhau: dùng AI thay thế kỹ sư vận hành.

IncidentFox

Link chính thức:

AI SRE agent — tự động phân loại, điều tra, sửa lỗi sự cố sản xuất, hoạt động trong Slack.

Dữ liệu cốt lõi: mã nguồn mở (Apache 2.0), GitHub hơn 420 sao, hơn 300 tích hợp sẵn, hỗ trợ Kubernetes/AWS/Grafana/Prometheus/Datadog/PagerDuty/GitHub

Mô hình kinh doanh: mã nguồn mở cốt lõi + phiên bản doanh nghiệp (sandbox an toàn, proxy chứng thực, quản lý đa nhóm). Triển khai trong chưa đầy 1 ngày.

Điểm sáng đội ngũ: Jimmy Wei — cựu Roblox (xây dựng chức năng liên lạc xã hội, phục vụ hơn 1 tỷ lượt truy cập/ngày), từng làm nghiên cứu AI đa phương tại Meta FAIR, tốt nghiệp CS Cornell. Long Yi — cựu nhóm hạ tầng trạng thái Roblox (hạ tầng cơ sở dữ liệu, hỗ trợ hơn 1 tỷ lượt truy cập/ngày). Hai người một làm AI, một làm vận hành, bổ sung hoàn hảo.

Đối thủ/rủi ro: PagerDuty, Incident.io (huy động hơn 50 triệu USD), Datadog, ServiceNow đều mở rộng sang AI vận hành. Nhưng điểm khác của IncidentFox là “tự động tạo tích hợp” — các công cụ khác yêu cầu bạn mất vài tuần để kết nối thủ công hệ thống nội bộ, còn IncidentFox phân tích mã nguồn và lịch sử sự cố của bạn rồi tự động tạo ra.

Điểm nổi bật khác: tuân thủ SOC 2. Mỗi cuộc điều tra chạy trong container cách ly, agent không thể thấy khóa gốc. Cũng có plugin Claude Code dành cho nhà phát triển cá nhân.

Điểm cốt lõi của IncidentFox là: lý do thất bại của công cụ AI vận hành không phải do mô hình không đủ mạnh, mà là do tích hợp chưa đủ sâu. Nhóm của bạn dùng Kafka nội bộ, hệ thống triển khai tự phát triển, nhóm ML tự xây dịch vụ mô hình — các công cụ AI chung không thể tích hợp. IncidentFox phân tích mã nguồn và lịch sử sự cố, tự động phát hiện thiếu tích hợp gì, rồi tự tạo ra. Con người chỉ cần phê duyệt.

Chris Lu trong tweet mô tả IncidentFox là “Kỹ sư AI SRE tự sửa lỗi sự cố sản xuất”. Định vị này vừa là tin vui, vừa là mối đe dọa cho kỹ sư vận hành.

Mendral (0.9 vạn truy cập/tháng) làm AI DevOps. Khác với IncidentFox “sửa lỗi sau”, Mendral hướng tới “vận hành hàng ngày” — tích hợp liên tục, quản lý triển khai, cấu hình môi trường.

Corelayer (0.4 vạn truy cập/tháng) làm “kỹ sư vận hành AI dựa trên dữ liệu”. Nhấn mạnh vào debug dựa trên dữ liệu — không đoán mò vấn đề, mà tự liên kết qua chỉ số và logs.

Sonarly (0.2 vạn truy cập/tháng) làm kỹ sư cảnh báo AI cho sản xuất. Tập trung xử lý cảnh báo — phân loại, trùng lặp, liên kết hàng loạt cảnh báo, tìm ra những cảnh cần người chú ý.

Lucent (1.6 vạn truy cập/tháng) làm AI tự động xem lại các phiên trò chuyện để phát hiện lỗi — không tìm lỗi từ mã, mà từ trải nghiệm người dùng. AI xem video các phiên người dùng 24/7, tự phát hiện lag, lỗi, luồng bất thường, rồi tạo ticket bug trong Slack và Linear, kèm theo toàn bộ ngữ cảnh tái tạo.

Sáng lập Alisa Rae có câu chuyện đáng kể: người Úc, từng khởi nghiệp và bán lại một công ty công nghệ giáo dục, là nhân viên thứ 2 của MagicBrief (sau đó được Canva mua lại), từng làm biên tập Rich Text tại Atlassian. Lần đầu xin YC bị từ chối, được khuyên “tìm đồng sáng lập”. Cô kiên trì solo, gọi vốn seed 2 triệu USD, lần thứ hai được chọn. Đã có hơn 30 công ty YC dùng, phản hồi: “Tuần đầu đã phát hiện 7 lỗi chưa từng gặp”, “Tuần đầu đã hòa vốn”. 94% người dùng gặp lỗi không báo, trực tiếp mất khách — đó là lý do Lucent tồn tại.

Điểm chung của 5 công ty này: phần lớn thời gian của kỹ sư vận hành không phải là “sửa lỗi”, mà là “tìm lỗi”. Từ hàng chục hệ thống giám sát liên kết tín hiệu, xem logs, kiểm tra thay đổi triển khai gần nhất — quá trình điều tra này chiếm trung bình 80% thời gian sửa lỗi. AI agent có thể kiểm tra tất cả dữ liệu cùng lúc, liên kết trong giây, rút ngắn thời gian “tìm lỗi” từ giờ xuống phút.

Phân nhóm con 2: AI kiểm thử/QA — Canary, Ashr

2 công ty làm AI kiểm thử.

Canary làm “kỹ sư QA AI hiểu mã nguồn đầu tiên của bạn”. Từ khóa là “hiểu mã nguồn” — không phải công cụ kiểm thử chung chung, mà là đọc hiểu logic mã của bạn rồi sinh ra các test case phù hợp. Các công cụ AI kiểm thử truyền thống thường sinh ra các test case không phù hợp thực tế.

Link chính thức:

Ashr làm kiểm thử đa mô thức tự động cho agent. “Đa mô thức” nghĩa là không chỉ kiểm tra giao diện văn bản, mà còn kiểm tra hình ảnh, video, âm thanh, tương tác khác. Khi AI ngày càng dùng nhiều đầu vào/đầu ra đa mô thức, công cụ kiểm thử cũng cần theo kịp.

Phân nhóm con 3: Tự động hóa quy trình làm việc AI — RamAIn, Bubble Lab, Jinba, Ressl AI, EigenPal, Carson, Crow

Nhóm này hướng tới nhóm người dùng rộng nhất — không phải nhà phát triển, mà tất cả người cần tự động hóa công việc.

RamAIn

Link chính thức:

“Siêu máy tính nhanh nhất thế giới dùng agent” — dạy AI thao tác như người, di chuyển dữ liệu giữa trình duyệt và ứng dụng desktop.

Dữ liệu cốt lõi: 35 nghìn truy cập/tháng, đã có các nhóm mua hàng, bảo hiểm, y tế, tài chính sử dụng. Triển khai trong vài ngày.

Điểm sáng đội ngũ: Hai sinh viên IIT Delhi — CEO Shourya từng làm dự án AI doanh nghiệp tại McKinsey, sáng lập Genoshi (studio AI tự bootstrap thu về sáu chữ số), là kỳ thủ cờ FIDE 2118 điểm, đại diện Ấn Độ thi đấu 17 quốc gia.

Mô hình kinh doanh: doanh nghiệp — tự động di chuyển dữ liệu giữa hệ thống cũ, ứng dụng desktop, cổng web. Khách hàng mục tiêu: nhóm mua hàng (ERP + cổng nhà cung cấp), môi giới bảo hiểm (cổng bảo hiểm), bệnh viện (hồ sơ bệnh án điện tử + cổng lab), nhóm tài chính (quản lý chu kỳ doanh thu).

Đối thủ/rủi ro: Anthropic Computer Use, OpenAI Operator là mối đe dọa lớn nhất. Điểm khác của RamAIn là “huấn luyện trước trên giao diện cụ thể” — CUA chung (chụp màn hình → mô hình thị giác → quyết định → lặp lại) đắt, chậm, không ổn định, RamAIn học giao diện của bạn rồi tự động hóa. Còn có khả năng “tự sửa” — UI thay đổi không gây lỗi, khác với RPA truyền thống.

Bubble Lab (19 nghìn truy cập/tháng) làm “một câu lệnh, tự động mãi mãi”. Biến quy trình lặp đi lặp lại thành tự động chỉ bằng một câu. Định vị đơn giản hơn Zapier — Zapier cần cấu hình trigger và bước, còn Bubble Lab chỉ mô tả muốn tự động gì.

Jinba (17 nghìn truy cập/tháng) tự động hóa mọi quy trình doanh nghiệp qua chat. Trong giao diện chat, kích hoạt phê duyệt, luân chuyển dữ liệu, tích hợp hệ thống.

Ressl AI (17 nghìn truy cập/tháng) làm agent cấu hình ERP/CRM. Sau khi doanh nghiệp dùng Salesforce hoặc SAP, việc cấu hình và tùy biến là công việc lớn. Ressl AI dùng AI để làm các bước cấu hình này.

EigenPal (9 nghìn truy cập/tháng) làm quy trình tài liệu AI doanh nghiệp. Carson làm không gian làm việc AI trên desktop (đã phân tích kỹ trong bài OpenClaw, không lặp lại). Crow (25 nghìn truy cập/tháng) làm “cho phép người dùng điều khiển ứng dụng qua chat” — thêm lớp chat AI cho mọi SaaS, người dùng không cần học giao diện, chỉ dùng chat để hoàn thành nhiệm vụ.

Điểm chung của 7 công ty này: Lập trình AI giảm rào cản “viết mã”, nhưng phần lớn công việc không cần viết mã — cần kết nối các công cụ hiện có, tự động hóa các quy trình lặp lại. Nhóm này làm “tự động hóa không viết mã”.

Phân nhóm con 4: Hạ tầng phát triển Agent — Emdash, Overshoot, Cardboard, Glue, Sila, Valgo, SideKit, Wideframe

Cung cấp công cụ cho người tạo agent.

Emdash (23 nghìn truy cập/tháng) xây dựng môi trường phát triển agent mã nguồn mở — hơn 60 nghìn lượt tải, 2430 sao GitHub. Hỗ trợ chạy song song nhiều agent mã hóa, mọi nhà cung cấp mô hình. Gần giống bài trước về “1 code” nhưng nhấn mạnh hơn vào mã nguồn mở và không phụ thuộc mô hình.

Link chính thức:

Overshoot (16 nghìn truy cập/tháng) làm nền tảng ứng dụng thị giác AI — giúp nhà phát triển xây dựng và vận hành các ứng dụng thị giác AI. Khi mô hình đa mô thức phổ biến, “AI xem hình” là phân khúc tăng trưởng nhanh.

Cardboard (7 nghìn truy cập/tháng) làm trình chỉnh sửa video agent. AI agent tự cắt, ghép, thêm phụ đề và hiệu ứng. Trước đây làm video cần kỹ năng chuyên nghiệp và phần mềm đắt tiền, Cardboard muốn hạ thấp rào cản chỉ cần nói “tôi muốn hiệu ứng này”.

Glue thiết kế giao diện cho agent — khi agent cần giao diện front-end, Glue giúp thiết kế. Khi nhiều agent cần bảng điều khiển trực quan, nhu cầu này sẽ tăng.

Sila làm hạ tầng truyền tin giữa các agent — khi nhiều agent làm việc cùng nhau, làm thế nào truyền thông tin? Sila giải quyết vấn đề này.

Valgo (3 nghìn truy cập/tháng) kiểm tra an toàn thuật toán hệ thống tự chủ. SideKit (2 nghìn truy cập/tháng) cung cấp giải pháp triển khai ứng dụng di động toàn diện (ít công ty AI trong này). Wideframe làm cộng tác viên chỉnh sửa video AI.

Xem tổng thể 22 công ty

Một số nhận xét:

Thứ nhất, AI vận hành (5 công ty) là nhóm sản phẩm đã trưởng thành nhất trong 22. IncidentFox đã mã nguồn mở, có hơn 300 tích hợp, tuân thủ SOC 2. Không phải ngẫu nhiên — vận hành là lĩnh vực AI dễ chứng minh giá trị nhất: thời gian sửa lỗi giảm từ vài giờ xuống phút, rõ ràng đo đếm được.

Thứ hai, tự động hóa quy trình làm việc (7 công ty) đối mặt với đối thủ lớn nhất không phải là nhau, mà là các công cụ tự động hóa hiện tại — Zapier, Make, n8n. AI giúp các công cụ này “thông minh hơn”, nhưng các công cụ cũ cũng nhanh chóng tích hợp AI. 7 công ty nhỏ này cần tìm điểm hẹp đủ để tồn tại trước Zapier (định giá hơn 5 tỷ USD).

Thứ ba, hạ tầng phát triển agent (8 công ty) là cược dài hạn. Hiện số lượng agent chưa đủ nhiều, giá trị hạ tầng chưa rõ ràng. Nhưng nếu mô hình agent bùng nổ (như trong bài về Fintech, nơi Sponge đã mở tài khoản ngân hàng cho agent), chuỗi công cụ tạo agent sẽ trở thành cơ hội cấp độ hạ tầng đám mây.

Thứ tư, 22 công ty này đều là B2B. Như mọi bài trong series này — YC W26 là batch hoàn toàn B2B. Công cụ AI bán cho doanh nghiệp và nhà phát triển, không bán cho người tiêu dùng.

Thông điệp cho đội nhóm Trung Quốc

Thứ nhất, nhu cầu AI vận hành tại Trung Quốc rất lớn. Các công ty internet Trung Quốc (ByteDance, Alibaba, Tencent, Meituan) vận hành không nhỏ hơn Mỹ, nhưng công cụ AI chưa phổ biến. Các hệ thống giám sát nội bộ (ARMS của Alibaba, APMPlus của ByteDance) chưa mạnh như Datadog về AI. Nếu có nhóm làm “phiên bản Trung Quốc của IncidentFox” — tích hợp hệ thống giám sát nội địa, hỗ trợ logs tiếng Trung, hiểu hệ sinh thái công nghệ trong nước, thị trường sẽ có.

Thứ hai, tự động hóa quy trình làm việc tại Trung Quốc có một bối cảnh đặc biệt — DingTalk và Feishu. Hai nền tảng này là cổng làm việc chính của doanh nghiệp, nhưng khả năng tự động hóa còn sơ khai. Nếu có nhóm làm “AI tự động hóa quy trình trong DingTalk/Feishu” (giống Jinba làm cho Slack), sẽ dễ mở rộng hơn so với xây dựng nền tảng mới từ đầu.

Thứ ba, công cụ phát triển agent tại Trung Quốc còn trống rỗng. Mỹ đã có Emdash, Glue, Sila, còn Trung Quốc chưa có công cụ tương đương. Khi số nhà phát triển agent trong nước tăng, thị trường này sẽ mở ra.

Những nhận định có thể mang đi

  1. Nút thắt chính của AI vận hành không phải là khả năng mô hình, mà là độ sâu tích hợp. Ý tưởng “tự động tạo tích hợp” của IncidentFox đáng để các nhóm phát triển công cụ doanh nghiệp học hỏi — AI của bạn dù thông minh đến đâu, nếu không kết nối được hệ thống khách hàng thì không làm gì được.

  2. “Tự động hóa không viết mã” đang trở thành một phân khúc độc lập. Lưu lượng của RamAIn (35 nghìn), Bubble Lab (19 nghìn), Crow (25 nghìn) chứng tỏ nhu cầu thực sự. Các công cụ này không hướng tới nhà phát triển, mà tới tất cả nhân viên tri thức — thị trường này lớn hơn gấp 10 lần thị trường công cụ nhà phát triển.

  3. Hạ tầng phát triển agent là hướng “đúng dài hạn nhưng chưa sinh lời ngắn hạn”. Giống như làm hạ tầng đám mây năm 2010 — khi đó ít ứng dụng trên đám mây, hạ tầng có vẻ dư thừa. Nhưng khi ứng dụng bùng nổ, hạ tầng trở thành tầng sinh lời nhất. Hạ tầng agent có thể lặp lại câu chuyện này.

  4. Cả series này, cộng với bài trước, tổng cộng 34 công ty trong lĩnh vực DevTools — lớn nhất của W26. Điều này phản ánh rõ ràng: AI đầu tiên thay đổi cách “làm phần mềm”, rồi mới đến các ngành khác. Công cụ nhà phát triển là “sân nhà” của AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim