Kinh thánh về giao dịch chênh lệch Polymarket: Sự khác biệt thực sự nằm ở cơ sở hạ tầng toán học

Tiêu đề gốc: The Math Needed for Trading on Polymarket (Complete Roadmap)

Tác giả gốc: Roan

Nguồn gốc gốc:

Chuyển thể: Mars Finance

Trong quá trình thành lập @insidersdotbot, tôi đã có nhiều cuộc trao đổi sâu sắc với các nhóm market maker cao cấp và nhóm arbitrage. Trong đó, nhu cầu lớn nhất là làm thế nào để xây dựng chiến lược arbitrage.

Người dùng, bạn bè, đối tác của chúng tôi đều đang khám phá con đường giao dịch phức tạp và đa chiều của Polymarket. Nếu bạn là người dùng tích cực trên Twitter, tôi tin rằng bạn đã từng thấy những tweet kiểu như “Tôi đã kiếm được bao nhiêu tiền từ chiến lược arbitrage XX trên thị trường dự đoán.”

Tuy nhiên, phần lớn các bài viết đều quá đơn giản hóa logic nền tảng của arbitrage, biến nó thành kiểu “Tôi làm được, tôi cũng làm được”, “Chỉ cần Clawdbot là đủ”, mà không đi sâu giải thích cách hệ thống hóa để hiểu và phát triển hệ thống arbitrage của riêng mình.

Nếu bạn muốn hiểu rõ cách các công cụ arbitrage trên Polymarket kiếm tiền, bài viết này là phần giải thích đầy đủ nhất mà tôi từng thấy.

Vì bản gốc tiếng Anh có nhiều phần quá kỹ thuật, cần nghiên cứu thêm, tôi đã tái cấu trúc và bổ sung để mọi người chỉ cần đọc bài này là có thể nắm rõ tất cả các nội dung chính, không cần phải dừng lại tra cứu.

Arbitrage trên Polymarket không đơn giản chỉ là vấn đề toán học

Bạn thấy một thị trường trên Polymarket:

YES giá $0.62, NO giá $0.33.

Bạn nghĩ: 0.62 + 0.33 = 0.95, chưa tới 1 đô la, có thể có cơ hội arbitrage! Mua cả YES và NO, tổng chi $0.95, dù kết quả thế nào cũng thu về $1.00, lãi ròng $0.05.

Bạn đúng rồi.

Nhưng vấn đề là — khi bạn còn đang tính tay phép cộng này, hệ thống định lượng đã làm một việc hoàn toàn khác.

Chúng đang quét đồng thời 17,218 điều kiện, vượt qua 2^63 khả năng kết quả, trong mili giây tìm ra tất cả các mâu thuẫn về định giá. Khi bạn hoàn tất đặt hai lệnh, chênh lệch giá đã biến mất. Hệ thống đã sớm tìm ra các lỗ hổng tương tự trong hàng chục thị trường liên quan, tính toán kích thước vị thế tối ưu sau khi xem xét độ sâu order book và phí giao dịch, thực hiện song song tất cả các giao dịch rồi chuyển vốn sang cơ hội tiếp theo.[1]

Chênh lệch không chỉ là về tốc độ. Đó là hạ tầng toán học.

Chương 1: Tại sao “Phép cộng” không đủ — Vấn đề đa diện biên giới

Sai lầm trong thị trường đơn

Xem ví dụ đơn giản.

Thị trường A: “Trump có thắng trong cuộc bầu cử tại Pennsylvania không?”

YES giá $0.48, NO giá $0.52. Tổng cộng đúng bằng $1.00.

Có vẻ hoàn hảo, không có cơ hội arbitrage, đúng không?

Sai rồi.

Thêm một thị trường nữa, vấn đề bắt đầu nảy sinh.

Thị trường B: “Đảng Cộng hòa có vượt qua đối thủ hơn 5 điểm phần trăm tại Pennsylvania không?”

YES giá $0.32, NO giá $0.68. Tổng cộng cũng là $1.00.

Hai thị trường đều “bình thường”. Nhưng có một mối liên hệ logic:

Bầu cử tổng thống Mỹ không phải tính toàn quốc một lượt, mà theo từng bang. Mỗi bang là một “chiến trường” riêng biệt, ai thắng nhiều phiếu hơn trong bang đó, người đó thắng toàn bộ phiếu đại cử tri của bang đó (quy luật thắng tất). Trump là ứng viên đảng Cộng hòa. Vậy “Đảng Cộng hòa thắng tại Pennsylvania” và “Trump thắng tại Pennsylvania” — là cùng một chuyện. Nếu đảng Cộng hòa thắng hơn 5 điểm, không chỉ có nghĩa Trump thắng tại Pennsylvania, mà còn thắng lớn.

Nói cách khác, YES của thị trường B (“đảng Cộng hòa thắng lớn”) là một tập con của YES của thị trường A (“Trump thắng”). Thắng lớn tất nhiên là thắng, nhưng thắng không nhất thiết là thắng lớn.

Logic phụ thuộc này tạo ra cơ hội arbitrage.

Nó giống như bạn cược hai việc — “Ngày mai có mưa không” và “Ngày mai có bão tố không”.

Nếu có bão, chắc chắn sẽ có mưa (bão là tập con của mưa). Vậy giá của “bão YES” không thể cao hơn “mưa YES”. Nếu định giá thị trường vi phạm logic này, bạn có thể mua thấp bán cao, kiếm lợi “không rủi ro”, chính là arbitrage.

Vụ nổ chỉ số: Tại sao tìm kiếm brute-force không khả thi

Với bất kỳ thị trường nào có n điều kiện, lý thuyết có 2^n khả năng kết quả.

Nghe có vẻ ổn? Xem ví dụ thực tế.

Thị trường NCAA 2010 [2]: 63 trận đấu, mỗi trận có 2 kết quả thắng/thua. Tổng số kết quả có thể là 2^63 = 9.223.372.036.854.775.808 — hơn chín trăm tỷ tỷ khả năng. Có hơn 5000 mức giá.

2^63 lớn thế nào? Nếu kiểm tra 1 tỷ khả năng mỗi giây, cần khoảng 292 năm mới xong. Đó là lý do vì sao “tìm kiếm brute-force” ở đây hoàn toàn không khả thi.

Kiểm tra từng kết quả? Không thể tính toán nổi.

Xem đến cuộc bầu cử Mỹ 2024. Nhóm nghiên cứu phát hiện ra 1,576 cặp thị trường có thể phụ thuộc nhau. Nếu mỗi cặp có 10 điều kiện, thì cần kiểm tra 2^20 = 1,048,576 khả năng. Nhân với 1,576 cặp, máy tính của bạn cũng xong trước khi kết quả bầu cử ra.

Lập trình nguyên (Integer Programming): Thay thế liệt kê bằng ràng buộc

Giải pháp của hệ thống định lượng không phải “liệt kê nhanh hơn”, mà là không liệt kê.

Chúng dùng Integer Programming để mô tả “kết quả hợp lệ”.

Xem ví dụ thực tế. Thị trường Duke vs Cornell: mỗi đội có 7 mức thắng (từ 0 đến 6 trận), tổng cộng 14 điều kiện, 2^14 = 16,384 khả năng.

Nhưng có một ràng buộc: không thể cả hai đội đều thắng hơn 4 trận, vì như vậy họ sẽ gặp nhau ở vòng bán kết (chỉ một đội đi tiếp).

Làm thế nào để dùng Integer Programming? Chỉ cần ba ràng buộc:

· Ràng buộc 1: Trong 7 mức thắng của Duke, đúng một cái là đúng (Duke chỉ có thể thắng đúng một số trận cuối cùng).

· Ràng buộc 2: Trong 7 mức thắng của Cornell, đúng một cái là đúng.

· Ràng buộc 3: Tổng của các thắng của Duke 5 + 6 + của Cornell 5 + 6 ≤ 1 (không thể cùng thắng nhiều hơn 4 trận).

Ba ràng buộc tuyến tính này thay thế cho 16,384 lần kiểm tra brute-force.

Nói cách khác, brute-force giống như đọc từng từ trong từ điển để tìm một từ. Còn Integer Programming như mở trang sách bắt đầu bằng chữ cái đó. Bạn không cần kiểm tra tất cả khả năng, chỉ cần mô tả “đáp án hợp lệ như thế nào”, rồi để thuật toán tìm những kết quả vi phạm quy tắc về định giá.

Dữ liệu thực tế: 41% thị trường có arbitrage [2]

Trong bài viết, nhóm nghiên cứu phân tích dữ liệu từ tháng 4/2024 đến tháng 4/2025:

• Kiểm tra 17,218 điều kiện

• Trong đó 7,051 điều kiện có arbitrage đơn lẻ (chiếm 41%)

• Sai lệch định giá trung vị: $0.60 (đáng lẽ phải là $1.00)

• 13 cặp thị trường xác nhận có thể khai thác arbitrage chéo

Sai lệch trung vị $0.60 cho thấy thị trường thường xuyên lệch khoảng 40%. Đây không phải là “gần đúng hiệu quả”, mà là “lớn và có thể khai thác”.

Chương 2: Phép chiếu Bregman — Tính ra arbitrage tối ưu

Phát hiện arbitrage là một vấn đề. Tính ra chiến lược arbitrage tối ưu là một vấn đề khác.

Bạn không thể đơn giản “lấy trung bình” hoặc “điều chỉnh giá chút đỉnh”. Bạn cần chiếu trạng thái thị trường hiện tại vào không gian hợp lệ không có arbitrage, đồng thời giữ nguyên cấu trúc thông tin trong giá.

Tại sao “khoảng cách đường thẳng” không khả thi

Ý tưởng trực quan nhất là: tìm giá hợp lệ gần nhất với giá hiện tại, rồi thực hiện giao dịch chênh lệch.

Trong toán học, đó là tối thiểu hóa khoảng cách Euclid: ||μ - θ||²

Nhưng có vấn đề chết người: nó coi mọi biến động giá như nhau.

Từ $0.50 tăng lên $0.60, và từ $0.05 tăng lên $0.15, đều là tăng 10 xu. Nhưng ý nghĩa thông tin hoàn toàn khác nhau.

Tại sao? Vì giá thể hiện xác suất ngụ ý. Từ 50% lên 60% là điều chỉnh nhẹ nhàng về quan điểm. Từ 5% lên 15% là một sự thay đổi niềm tin lớn — một sự kiện gần như không thể xảy ra đột nhiên trở thành “có khả năng”.

Tưởng tượng bạn cân cân nặng. Từ 70 kg lên 80 kg, bạn nói “béo hơn chút”. Nhưng từ 30 kg lên 40 kg (nếu bạn là người trưởng thành), đó là “gần chết rồi trở thành suy dinh dưỡng nặng”. Cũng là 10 kg, ý nghĩa hoàn toàn khác. Giá cũng vậy — biến động gần 0 hoặc 1 mang ý nghĩa lớn hơn nhiều.

Bregman Divergence: “khoảng cách” đúng đắn

Các nhà tạo lập thị trường của Polymarket dùng LMSR (hệ thống điểm thị trường dựa trên log) [4], giá thể hiện phân phối xác suất.

Trong cấu trúc này, thước đo “khoảng cách” đúng là Bregman Divergence [5].

Với LMSR, Bregman Divergence chính là KL Divergence (Kullback-Leibler) [6] — một thước đo “khoảng cách thông tin” giữa hai phân phối xác suất.

Bạn không cần nhớ công thức. Chỉ cần hiểu một điều:

KL Divergence tự nhiên sẽ tăng trọng số cho “biến động giá cực đoan”. Từ $0.05 đến $0.15 trong KL Divergence “lớn hơn” so với từ $0.50 đến $0.60. Điều này phù hợp trực giác của chúng ta — biến động giá cực đoan mang ý nghĩa thông tin lớn hơn.

Ví dụ điển hình là trong thị trường dự đoán của @zachxbt, khi Axiom vượt lên Meteora vào phút chót, cũng dựa trên biến động giá cực đoan, thể hiện mọi thay đổi.

Lợi nhuận arbitrage = Khoảng cách Bregman Projection

Đây là một trong những kết luận cốt lõi của bài viết gốc:

Bất kỳ giao dịch nào cũng có thể đạt lợi nhuận tối đa bằng khoảng cách Bregman từ trạng thái thị trường hiện tại đến không gian không có arbitrage.

Nói cách khác: giá thị trường lệch khỏi “không gian hợp lệ” càng xa, bạn càng kiếm được nhiều. Và Bregman Projection sẽ cho bạn biết:

  1. Nên mua hay bán (hướng dự đoán)

  2. Nên mua hay bán bao nhiêu (xem xét độ sâu order book)

  3. Có thể kiếm bao nhiêu (khoảng cách dự đoán chính là lợi nhuận tối đa)

Top arbitrageurs kiếm trung bình 1 năm hơn $2 triệu (tổng hơn $39 triệu) [2]. Người đứng đầu kiếm được hơn $2 triệu, từ 4049 giao dịch, trung bình mỗi giao dịch khoảng $496.

Không phải xổ số. Không phải may mắn. Là hệ thống hóa chính xác dựa trên toán học.

Thực tế cuối cùng

Khi các trader còn đang đọc “10 mẹo dự đoán thị trường”, hệ thống định lượng đang làm gì?

Chúng dùng Integer Programming để kiểm tra mối quan hệ phụ thuộc giữa 17,218 điều kiện. Tính Bregman để ra chiến lược arbitrage tối ưu. Chạy thuật toán Frank-Wolfe để xử lý vấn đề gradient bùng nổ. Ước lượng slippage qua VWAP rồi thực hiện order song song. Hệ thống hóa để khai thác hơn 40 triệu đô lợi nhuận đảm bảo.

Khoảng cách không phải do may mắn. Đó là hạ tầng toán học.

Bài báo đã công khai [1]. Thuật toán đã biết. Lợi nhuận là có thật.

Vấn đề là: Trước khi khai thác 40 triệu đô tiếp theo, bạn có thể xây dựng được hệ thống chưa?

Tóm tắt nhanh các khái niệm

• Marginal Polytope (đa diện biên giới) → không gian “giá hợp lệ”. Giá phải nằm trong này mới không có arbitrage. Hiểu đơn giản là “vùng giá hợp pháp”.

• Integer Programming (lập trình nguyên) → mô tả kết quả hợp lệ bằng ràng buộc tuyến tính, tránh liệt kê brute-force. Rút ngắn 2^63 kiểm tra thành vài ràng buộc.

• Bregman / KL Divergence → đo “khoảng cách” giữa hai phân phối xác suất, phù hợp hơn Euclid trong không gian giá/xác suất. Biến động cực đoan có trọng số cao hơn.

• LMSR (hệ thống điểm thị trường dựa trên log) → cơ chế định giá của Polymarket, giá thể hiện xác suất ngụ ý.

• Frank-Wolfe → thuật toán tối ưu lặp, mỗi vòng chỉ thêm một đỉnh mới, tránh liệt kê hàng tỷ kết quả hợp lệ.

• Gurobi → trình giải lập Integer Programming hàng đầu, “hướng dẫn” mỗi vòng của Frank-Wolfe.

• CLOB (central limit order book) → cơ chế khớp lệnh của Polymarket, thực hiện theo thứ tự, không đảm bảo nguyên tử.

• VWAP (volume-weighted average price) → giá trung bình thực tế bạn trả, tính theo độ sâu order book, chính xác hơn “giá chào hàng tối ưu”.

• Kelly → công thức phân bổ vốn, cân bằng lợi nhuận và rủi ro.

• Non-atomic execution → vấn đề không thể đảm bảo tất cả các lệnh cùng thực hiện, một chân thành công, chân kia không, dễ lộ rủi ro.

• DeepSeek → mô hình ngôn ngữ lớn dùng sơ bộ phân tích phụ thuộc thị trường, độ chính xác 81.45%.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.42KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.44KNgười nắm giữ:2
    0.00%
  • Ghim