Tài liệu tóm tắt: Giới thiệu Lý thuyết Trò
chơi
© 2025 của Nejat Anbarci và Kemal Kıvanç Aköz
Tài liệu này tổng hợp các ý chính, khái niệm
quan trọng và ví dụ minh họa từ các đoạn trích của cuốn sách "Lý thuyết
trò chơi. Giới thiệu rất ngắn gọn và dễ hiểu" của Nejat Anbarci và Kemal
Kıvanç Aköz, với lời nói đầu của Hülya Eraslan. Mục đích là cung cấp một cái
nhìn tổng quan toàn diện về lý thuyết trò chơi, từ nguồn gốc, các khái niệm cơ
bản đến những ứng dụng thực tiễn và giới hạn của nó.
I. Lời nói đầu và Tổng quan về cuốn sách
·
Tính
dễ tiếp cận và thực tế của Lý thuyết trò chơi: Cuốn sách của Anbarci và Aköz được khen ngợi
vì đã biến một lĩnh vực thường phức tạp thành dễ tiếp cận, hấp dẫn và giải trí,
tránh xa các phương trình và sự trừu tượng. Các tác giả sử dụng các câu chuyện,
ví dụ và hình minh họa vui tươi để làm cho lý thuyết trò chơi trở nên sống
động, chỉ ra cách các khái niệm của nó biểu hiện trong cuộc sống hàng ngày,
kinh doanh, chính trị và thể thao.
·
Hülya Eraslan nhận
xét: "Cuốn sách này của Nejat Anbarci và Kıvanç Aköz không chỉ nghiêm túc
mà còn dễ tiếp cận, lôi cuốn và giải trí – một kỳ tích hiếm có trong một lĩnh
vực thường bị chi phối bởi các phương trình và sự trừu tượng."
·
Các tác giả khẳng
định: "Mọi tương tác trong cuộc sống, từ những điều bình thường đến những
điều to lớn, đều liên quan đến một mức độ chiến lược nào đó."
·
Mục
tiêu của cuốn sách: Giúp người đọc hiểu
lý thuyết trò chơi mà không cần bằng cấp nâng cao về toán học. Cuốn sách tập
trung vào việc truyền tải ý tưởng thông qua các câu chuyện và ví dụ thực tế.
·
Tác giả chia sẻ:
"Chúng tôi tin rằng việc học nên là niềm vui, không phải là nỗi đau. Ngay
cả những chủ đề phức tạp nhất cũng có thể được truyền đạt – ở một mức độ nào đó
– tới một lượng lớn độc giả một cách thú vị."
·
Tôn
vinh John Nash: Cuốn sách được coi là
sự tôn vinh đối với John Nash, một trong những người sáng lập lý thuyết trò
chơi, người đã có những đóng góp đột phá về cân bằng Nash và giành giải Nobel
Kinh tế năm 1994. Cuốn sách cũng bao gồm một lá thư từ Nash gửi cho Nejat
Anbarci.
II. Nguồn gốc và Sự phát triển của Lý thuyết
Trò chơi
·
Sự
ra đời: Lý thuyết trò chơi
nổi lên như một lĩnh vực vào những năm 1940, trong và sau Thế chiến thứ hai, do
nhu cầu phân tích và phát triển các chính sách nhằm tránh các xung đột thảm
khốc.
·
Những
người tiên phong:John von Neumann và Oscar Morgenstern: Cuốn sách "Theory of Games and Economic
Behavior" (1944) của họ được coi là khởi đầu cho lý thuyết trò chơi.
·
John
Nash: Đã có bước nhảy vọt
lớn vào những năm 1950 với khái niệm cân bằng Nash (1951), được coi là công
trình cơ bản nhất trong lĩnh vực này.
·
Thế
lưỡng nan của tù nhân:
Ra đời vào năm 1950 trong bối cảnh Chiến tranh Lạnh, trò chơi này đã thay đổi
cách các nhà kinh tế nghĩ về cạnh tranh và hợp tác.
·
Ứng
dụng rộng rãi: Trong vòng chưa đầy
80 năm, lý thuyết trò chơi đã ảnh hưởng đến nhiều lĩnh vực từ kỹ thuật điện và
máy tính đến sinh học, tâm lý học, đạo đức học, và các ứng dụng chính sách như
tạo ra thị trường mới hay cải thiện ghép tạng.
·
"Trong chưa đầy
80 năm, lý thuyết trò chơi đã biến thành một trong những phương pháp quan trọng
nhất được sử dụng trong toàn bộ vũ trụ khoa học."
III. Nền tảng của Lý thuyết Trò chơi: Tương
tác chiến lược
·
Định
nghĩa: Lý thuyết trò chơi là
"khoa học của chiến lược," phân tích các loại hành vi và tương tác
chiến lược trong hầu hết mọi khía cạnh của cuộc sống hiện đại.
·
Các
yếu tố của trò chơi:Người chơi: Các cá nhân hoặc thực thể tham gia.
·
Chiến
lược: Kế hoạch hành động
của mỗi người chơi để đạt được mục tiêu.
·
Kết
quả: Mỗi người chơi cố
gắng chọn chiến lược mang lại kết quả tốt nhất dựa trên hành động của những
người khác.
·
Khả
năng dự đoán: Việc dự đoán kết quả
trò chơi phụ thuộc vào mức độ hợp lý của người chơi và sự hiểu biết của họ về
các quy tắc. Tuy nhiên, yếu tố ngẫu nhiên và nhiều giải pháp (cân bằng) vẫn có
thể gây ra sự không chắc chắn.
IV. Các Khái niệm Chính trong Lý thuyết Trò
chơi và Ứng dụng
A. Chiến lược Trội và Loại bỏ lặp lại
·
Chiến
lược trội: Là chiến lược đảm bảo
kết quả tốt hơn, bất kể đối thủ của bạn làm gì. Ngược lại, chiến lược bị
trội là những lựa chọn kém hơn.
·
Thế
lưỡng nan của tù nhân:
Trò chơi mang tính biểu tượng nhất, minh họa cách lợi ích cá nhân của mỗi người
có thể dẫn đến kết quả tồi tệ hơn cho tập thể.
·
Ví
dụ: Hai tù nhân bị thẩm
vấn riêng biệt. Mỗi người có lựa chọn thú tội hoặc im lặng. Chiến lược trội cho
cả hai là thú tội, nhưng kết quả là cả hai phải ngồi tù lâu hơn so với việc cả
hai im lặng.
·
Ứng
dụng thực tế: Tình huống OPEC (các
quốc gia thành viên có xu hướng gian lận hạn ngạch để kiếm lợi ngắn hạn, dẫn
đến giá dầu giảm và lợi nhuận thấp hơn cho tất cả) và bi kịch của tài sản công
(cá nhân hành động vì lợi ích cá nhân làm cạn kiệt tài nguyên chung).
·
Loại
bỏ lặp lại các chiến lược bị trội: Quá trình loại bỏ các chiến lược kém hiệu quả qua từng vòng lặp
cho đến khi chỉ còn lại một chiến lược duy nhất hoặc một tập hợp chiến lược hợp
lý.
·
Trò
chơi đoán ("Thi sắc đẹp"): Người chơi chọn một số từ 0 đến 100. Người thắng là người chọn
số gần nhất với 2/3 trung bình của tất cả các số được chọn. Bằng cách loại bỏ
lặp lại, chiến lược hợp lý duy nhất là chọn 0.
·
Thứ
bậc nhận thức (Cognitive Hierarchy): Một mô hình hành vi thực tế hơn, thừa nhận người chơi có các
mức độ suy nghĩ chiến lược khác nhau (Cấp độ 0: ngẫu nhiên, Cấp độ 1: phản ứng
tốt nhất với Cấp độ 0, v.v.), giải thích sự khác biệt giữa lý thuyết và hành vi
thực tế.
B. Cân bằng Nash và Phối hợp
·
Cân
bằng Nash: Một tập hợp các chiến
lược (hồ sơ chiến lược) trong đó không người chơi nào có thể cải thiện kết quả
của mình bằng cách đơn phương thay đổi chiến lược, dựa trên những gì người chơi
khác đang làm.
·
"Trong một cân
bằng Nash, chiến lược của mỗi người chơi là phản ứng tốt nhất đối với các chiến
lược được chọn bởi những người chơi khác."
·
Lời
tiên tri tự hoàn thành:
Niềm tin của người chơi về hành động của người khác dẫn đến hành động xác nhận
niềm tin đó, tạo ra cân bằng Nash.
·
Trận
chiến giữa các giới: Một trò chơi có nhiều
cân bằng Nash, minh họa tầm quan trọng của sự phối hợp.
·
Ví
dụ: Jane và John muốn gặp
nhau nhưng mỗi người thích một địa điểm khác nhau (quán cà phê hoặc quán rượu).
Có hai cân bằng Nash: cả hai cùng đến quán cà phê hoặc cả hai cùng đến quán
rượu. Việc đạt được một cân bằng đòi hỏi sự phối hợp.
·
Tiêu
điểm (Focal Point / Schelling Point): Một cân bằng Nash nơi người chơi phối hợp chiến lược mà không
cần giao tiếp, thường nhờ các gợi ý văn hóa hoặc lịch sử.
C. Cạnh tranh và Đấu giá
·
Cạnh
tranh Bertrand: Mô hình cạnh tranh
giá cả giữa hai công ty bán sản phẩm giống hệt nhau. Cân bằng Nash là cả hai
công ty giảm giá xuống đến mức bằng chi phí biên (không có lợi nhuận).
·
Ví
dụ: Cuộc chiến giá giày
của Alice và Ben dẫn đến cả hai bán giày ở mức giá tối thiểu (chi phí).
·
Cạnh
tranh Downsian: Ứng dụng của
Hotelling's Game vào chính trị, nơi các đảng chính trị hướng về trung tâm để
giành phiếu bầu của cử tri trung vị.
·
Đấu
giá giá thứ hai (Second-Price Auction): Người thắng là người trả giá cao nhất, nhưng chỉ phải trả mức
giá cao thứ hai. Chiến lược trội ở đây là trả giá đúng bằng giá trị thực sự của
món đồ.
D. Chiến lược Hỗn hợp và Sự khó lường
·
Chiến
lược hỗn hợp: Người chơi ngẫu nhiên
hóa các lựa chọn của mình để trở nên khó đoán, thường được sử dụng trong các trò
chơi có tổng bằng không hoặc trò chơi xung đột.
·
Trò
chơi đồng xu (Matching Pennies): Anna thắng nếu hai đồng xu giống nhau, Bob thắng nếu khác nhau.
Cân bằng Nash là cả hai người chơi chọn sấp/ngửa với xác suất 50-50.
·
Trốn
thuế: Chính phủ quyết định
kiểm toán hay không kiểm toán, người nộp thuế quyết định trốn hay tuân thủ. Cân
bằng Nash chiến lược hỗn hợp tồn tại khi cả hai bên ngẫu nhiên hóa hành động
của mình để giữ cho đối thủ không quan tâm giữa các lựa chọn.
·
Ứng
dụng: Giải thích tại sao
các công ty nhỏ hơn có thể có xu hướng trốn thuế nhiều hơn do chi phí kiểm toán
tương đối cao và mức phạt nhỏ hơn. Khái niệm năng lực tài chính của nhà nước
cũng được đưa ra.
E. Trò chơi Động và Quy nạp ngược
·
Trò
chơi động: Các trò chơi có các
nước đi tuần tự, nơi người chơi quan sát hoặc nhận thông tin về các nước đi của
nhau.
·
Quy
nạp ngược (Backward Induction): Phương pháp tìm ra quyết định tối ưu bằng cách bắt đầu từ giai
đoạn cuối cùng của trò chơi và làm việc ngược lại.
·
Cân
bằng Nash hoàn hảo của trò chơi con (Subgame Perfect Nash Equilibrium - SPNE): Một chiến lược tạo thành cân bằng Nash trong
mọi trò chơi con, đảm bảo không có lời đe dọa không đáng tin cậy.
·
Trò
chơi Tối hậu thư (Ultimatum Game): Một người chơi đưa ra đề nghị chia một khoản tiền, người kia
chấp nhận hoặc từ chối (nếu từ chối, cả hai không nhận được gì).
·
Ví
dụ: William đề nghị
Edward chia gia tài. Lý thuyết trò chơi tiêu chuẩn dự đoán William sẽ đề nghị
phần nhỏ nhất có thể và Edward sẽ chấp nhận (vì tốt hơn không có gì).
·
Kinh
tế học hành vi: Trong thực tế, người
nhận thường từ chối những đề nghị quá thấp (dưới 40%) vì cảm giác bất công, và
người đưa đề nghị biết điều này, dẫn đến những đề nghị công bằng hơn.
·
Lời
đe dọa đáng tin cậy/không đáng tin cậy: Trong các trò chơi động, một lời đe dọa chỉ đáng tin cậy nếu
người đưa ra lời đe dọa thực sự có lợi khi thực hiện nó. Quy nạp ngược giúp
loại bỏ các lời đe dọa không đáng tin cậy.
·
Ví
dụ: Tranh chấp tiền thuê
nhà giữa bà Walker, Tom và Sarah. Lời đe dọa tăng tiền thuê quá cao của bà
Walker là không đáng tin cậy vì việc thực hiện nó sẽ tốn kém hơn cho bà so với
việc thỏa hiệp.
F. Ngăn chặn gia nhập và Chiến lược Cam kết
·
Ngăn
chặn gia nhập: Các công ty độc quyền
có thể áp dụng các chiến lược để ngăn cản đối thủ mới gia nhập thị trường.
·
Ủy
quyền chiến lược: Một người chơi ủy
quyền quyền ra quyết định cho người khác để ràng buộc bản thân vào một chiến
lược nhất định, ngăn chặn lợi ích ngắn hạn làm suy yếu lợi nhuận dài hạn.
·
Ví
dụ: Chủ quán cà phê David
ủy quyền toàn quyền quản lý cho Rachel, người có chiến lược mở rộng và cạnh
tranh giá mạnh mẽ, khiến chuỗi lớn Star Café quyết định không gia nhập thị
trường của David vì biết sẽ đối mặt với một cuộc chiến gây tổn thất.
G. Trò chơi Lặp lại và Yếu tố Thời gian
·
Trò
chơi lặp lại: Cùng một trò chơi (ví
dụ: Thế lưỡng nan của tù nhân) được chơi nhiều lần, có thể hữu hạn hoặc vô hạn.
·
Hệ
số chiết khấu: Phản ánh cách người
chơi định giá lợi nhuận trong tương lai so với lợi nhuận tức thì (mức độ kiên
nhẫn). Hệ số chiết khấu thấp (lãi suất cao) cho thấy sự thiếu kiên nhẫn, ưu
tiên lợi ích hiện tại.
·
Ví
dụ OPEC lặp lại: Nếu các quốc gia biết
khi nào trò chơi sẽ kết thúc (hữu hạn), họ sẽ gian lận ở giai đoạn cuối cùng và
logic quy nạp ngược sẽ khiến họ gian lận ở mọi giai đoạn. Nếu trò chơi là vô
hạn và các quốc gia đủ kiên nhẫn (hệ số chiết khấu cao), họ có thể duy trì hợp
tác. Nếu thiếu kiên nhẫn, họ sẽ gian lận.
H. Văn hóa Chính trị và Cân bằng Nash hoàn hảo
của trò chơi con
·
Tương
tác lặp lại và Văn hóa:
Các yếu tố văn hóa đóng vai trò quan trọng trong việc lựa chọn giữa các cân
bằng Nash hoàn hảo của trò chơi con (ví dụ: hợp tác hay không hợp tác) trong
các tương tác lặp lại dài hạn.
·
Bảo
trợ trong chính trị: Đảng cầm quyền có thể
chọn hợp tác (chia sẻ nguồn lực) hoặc không hợp tác (chiếm đoạt tất cả).
·
Lợi
ích giảm dần và ác cảm rủi ro: Lợi ích của việc có thêm tài nguyên giảm dần khi đã có nhiều,
và các đảng thường không thích rủi ro.
·
Ví
dụ: Trong một môi trường
chính trị cân bằng, hợp tác (chia sẻ nguồn lực 50-50) mang lại lợi ích lâu dài
cao hơn so với chiến lược "người thắng cuộc lấy tất cả". Tuy nhiên,
nếu một đảng có xác suất chiến thắng cao hơn đáng kể (bất đối xứng), sự cám dỗ
chiếm đoạt tất cả nguồn lực trở nên quá lớn, phá vỡ sự hợp tác.
I. Thông tin Bất đối xứng: Trò chơi Ra tín
hiệu và Sàng lọc
·
Trò
chơi thông tin không đầy đủ (Incomplete Information Games): Một người chơi có nhiều thông tin hơn người
kia.
·
Cân
bằng Nash Bayesian hoàn hảo (Perfect Bayesian Nash Equilibrium - PBNE): Khái niệm cân bằng được sử dụng trong các trò
chơi này, nơi các chiến lược là tối ưu trong mọi tình huống quyết định và quá
trình chơi phù hợp với kỳ vọng.
·
Trò
chơi ra tín hiệu (Signaling Game): Người chơi có thông tin tốt hơn (người gửi tín hiệu) thực hiện
một hành động (tín hiệu) để truyền đạt thông tin đó cho người chơi có ít thông
tin hơn (người nhận). Tín hiệu phải đủ "tốn kém" để đáng tin cậy.
·
Ví
dụ: Edward Smythe cải
trang thành lính canh để tránh "Jack điên loạn". Trang phục lính canh
là tín hiệu cho thấy Edward không phải là mục tiêu dễ dàng.
·
Ứng
dụng: Nhà độc quyền giữ giá
thấp để báo hiệu chi phí thấp cho đối thủ cạnh tranh tiềm năng; bằng cấp giáo
dục là tín hiệu về khả năng của sinh viên cho nhà tuyển dụng.
·
Trò
chơi sàng lọc (Screening Game): Người chơi có ít thông tin hơn (người sàng lọc) thiết kế một cơ
chế hoặc chuỗi đề nghị để khơi gợi thông tin từ người chơi có nhiều thông tin
hơn.
·
Ví
dụ: Người môi giới bất
động sản Margaret sử dụng các đề nghị giá và voucher để sàng lọc Helen Davies,
người mua tiềm năng, và đoán được ngân sách tối đa của bà ta.
·
Ứng
dụng: Đấu giá giá thầu thứ
hai (người bán tìm hiểu mức người mua sẵn sàng trả); các gói bảo hiểm khác nhau
giúp công ty bảo hiểm phân loại khách hàng theo mức độ rủi ro.
V. Tóm tắt và Kết luận
·
Phân
loại các khái niệm cân bằng:Trò chơi tĩnh: Chiến lược trội, loại bỏ lặp lại, cân bằng Nash thuần/hỗn hợp.
·
Trò
chơi động: Quy nạp ngược, cân
bằng Nash hoàn hảo của trò chơi con (SPNE).
·
Trò
chơi thông tin không đầy đủ: Cân bằng Nash Bayesian hoàn hảo (PBNE).
·
Giá
trị của Lý thuyết trò chơi:Mài
giũa tư duy phân tích, phản biện, học tập chủ động, giải quyết vấn đề và sáng
tạo – các kỹ năng hàng đầu được Diễn đàn Kinh tế Thế giới dự báo vào năm 2025.
·
Giúp cân nhắc hành
động của người khác và tìm ra chiến lược tối ưu.
·
Nhấn mạnh khó khăn của
sự hợp tác và vai trò của việc xây dựng niềm tin lâu dài.
·
Chỉ ra tầm quan trọng
của giao tiếp (dù là trực tiếp hay ngầm) để tránh các kết cục tiêu cực.
·
Lời
khuyên cuối cùng: Phát triển kỹ năng tư
duy chiến lược phù hợp với từng bối cảnh, tránh những chiến lược bị "lấn
át" và không hiệu quả.
VI. Lá thư từ John Harsanyi (thay vì John Nash
như được đề cập trong sách)
·
John
Harsanyi: Người đoạt giải Nobel
Kinh tế năm 1994 cùng với John Nash và Reinhard Selten, là tác giả của lá thư
này.
·
Nội
dung chính:Harsanyi thừa nhận
rằng lý thuyết trò chơi tiêu chuẩn (với thước đo tiện ích lý tưởng) đã tách rời
khỏi thực tế hành vi con người và đưa ra một bức tranh đơn giản hóa.
·
Ông gợi ý Nejat
Anbarci nên ghi nhớ yếu tố tâm lý học trong nghiên cứu về mặc cả với số lượng
lựa chọn hữu hạn.
·
Ông cũng nhắc đến khái
niệm cân bằng con (subgame perfect equilibrium) là của Reinhard Selten.
·
Harsanyi nhấn mạnh
rằng vẫn còn nhiều tranh cãi trong lý thuyết trò chơi và các ứng dụng của nó,
và khuyến khích Anbarci "bán" những ý tưởng thực sự có giá trị trong
thị trường mới nổi này.
1. Khái niệm
cốt lõi nào của lý thuyết trò chơi được trình bày và ứng dụng như thế nào?
Lý thuyết trò chơi, còn được gọi là "khoa học của
chiến lược", là môn học về các tương tác chiến lược, nghiên cứu cách
các cá nhân đưa ra quyết định khi kết quả phụ thuộc vào lựa chọn của những
người khác. Nó ra đời vào những năm 1940, với cuốn sách tiên phong "Lý
thuyết trò chơi và Hành vi kinh tế" của John von Neumann và Oscar
Morgenstern vào năm 1944, và có bước nhảy vọt lớn vào những năm 1950 nhờ vào
công trình của John Nash.
Dưới đây là các khái niệm cốt lõi của lý thuyết trò chơi
được trình bày trong các nguồn và cách chúng được ứng dụng:
1.
Chiến lược
trội và bị trội (Dominant and Dominated Strategies)
o Khái niệm:
§ Chiến lược trội
là chiến lược đảm bảo một kết quả tốt hơn cho người chơi, bất kể đối thủ làm
gì.
§ Chiến lược bị trội
là chiến lược kém hơn, mà người chơi không nên sử dụng vì luôn có một lựa chọn
tốt hơn.
o Ứng dụng:
§ Trong quả phạt đền của Roberto Baggio tại World Cup
1994, việc sút bóng ra ngoài là một chiến lược bị trội.
§ Trong ví dụ về Thế tiến thoái lưỡng nan của người tù,
việc thú tội là chiến lược trội cho mỗi tù nhân, nhưng trớ trêu thay, lại dẫn
đến kết quả tồi tệ hơn cho cả hai so với việc giữ im lặng.
§ Các quốc gia OPEC đối mặt với tình huống tương tự,
nơi việc sản xuất thừa dầu là chiến lược trội cho từng quốc gia, nhưng dẫn đến
giá dầu thấp hơn và lợi nhuận tổng thể kém hơn cho tất cả.
§ Trong đấu giá giá thứ hai, trả giá đúng giới hạn thực
sự của một món đồ là chiến lược trội.
2.
Loại bỏ lặp
lại các chiến lược bị trội nghiêm ngặt (Iterated Elimination of Strictly
Dominated Strategies - IE-SDS)
o Khái niệm:
Là một quá trình lặp đi lặp lại để loại bỏ các chiến lược bị trội cho tất cả
người chơi cho đến khi chỉ còn lại một chiến lược duy nhất hoặc một tập hợp các
chiến lược không thể loại bỏ thêm.
o Ứng dụng:
Được minh họa thông qua trò chơi đoán (ví dụ với hệ số p=2/3), nơi người
chơi chọn một số từ 0 đến 100 và người thắng là người chọn số gần nhất với 2/3
trung bình của tất cả các số đã chọn. Qua quá trình loại bỏ lặp lại, người chơi
hợp lý cuối cùng sẽ chọn số 0.
3.
Cân bằng
Nash (Nash Equilibrium)
o Khái niệm:
Là một hồ sơ chiến lược mà trong đó không có người chơi nào có thể cải thiện
lợi ích của mình bằng cách đơn phương thay đổi chiến lược, giả định rằng các
người chơi khác giữ nguyên chiến lược của họ.
o Ứng dụng:
§ Lời tiên tri tự hoàn thành
là một ý tưởng liên quan, nơi niềm tin của người chơi về hành động của người
khác dẫn đến việc các hành động đó thực sự xảy ra, xác nhận niềm tin ban đầu.
§ Trận chiến giữa các giới tính (ví dụ về Jane và John) cho thấy một trò chơi có nhiều cân
bằng Nash (cả hai cùng đến quán rượu hoặc cùng đến quán cà phê). Kết quả phụ
thuộc vào việc phối hợp kỳ vọng, đôi khi thông qua một "tiêu điểm"
(như gợi ý văn hóa hoặc lịch sử).
§ Cạnh tranh Bertrand
(ví dụ về Alice và Ben bán giày) cho thấy cân bằng Nash đạt được khi cả hai
công ty giảm giá sản phẩm đến mức bằng chi phí sản xuất, không kiếm được lợi
nhuận nào trên mỗi lần bán.
§ Trò chơi đồng xu
(Anna và Bob) minh họa cân bằng Nash chiến lược hỗn hợp, nơi mỗi người chơi
ngẫu nhiên hóa lựa chọn của mình (sấp hoặc ngửa với xác suất 50-50) để tránh bị
đối thủ dự đoán và lợi dụng.
§ Trò chơi trốn thuế
(Alec và chính phủ) cũng có cân bằng Nash chiến lược hỗn hợp, với xác suất trốn
thuế của Alec và xác suất kiểm toán của chính phủ được điều chỉnh để giữ cho cả
hai bên "dửng dưng" giữa các lựa chọn của họ.
4.
Trò chơi
động (Dynamic Games) và Quy nạp ngược (Backward Induction)
o Khái niệm:
§ Trò chơi động
là các trò chơi có các nước đi tuần tự, cho phép người chơi quan sát hoặc nhận
thông tin về hành động của nhau.
§ Quy nạp ngược
là phương pháp phân tích trò chơi động bằng cách bắt đầu từ giai đoạn cuối cùng
của trò chơi và đi ngược lại về đầu, loại bỏ các chiến lược không tối ưu và giữ
lại các phản ứng tốt nhất. Phương pháp này giúp loại bỏ các "mối đe dọa
không đáng tin cậy" – những lời đe dọa mà người đưa ra sẽ không thực hiện
vì không phải là lợi ích tốt nhất của họ.
§ Cân bằng Nash hoàn hảo của trò chơi con (Subgame Perfect
Nash Equilibrium - SPNE) là khái
niệm cân bằng áp dụng cho trò chơi động, yêu cầu chiến lược của mỗi người chơi
là phản ứng tốt nhất trong mọi trò chơi con (mọi giai đoạn có thể có của trò
chơi).
o Ứng dụng:
§ Trò chơi Tối hậu thư
(di chúc của ông Charles) cho thấy trong lý thuyết, người đưa ra đề nghị có thể
chỉ đưa ra một phần rất nhỏ và người kia sẽ chấp nhận vì nó tốt hơn không có
gì. Tuy nhiên, kinh tế học hành vi chỉ ra rằng trong thực tế, yếu tố công bằng
và lòng tự trọng có thể khiến người nhận từ chối đề nghị quá bất cân xứng.
§ Trong đàm phán tiền thuê nhà (bà Walker với Tom và
Sarah), mối đe dọa ban đầu của bà Walker về việc yêu cầu tăng 100% tiền thuê
nhà là không đáng tin cậy. Bằng quy nạp ngược, Tom và Sarah nhận ra bà Walker
sẽ chấp nhận một mức tăng hợp lý hơn (50%) để tránh rắc rối tìm người thuê mới.
§ Trong các trò chơi ngăn chặn gia nhập thị trường (ví
dụ về James/David và Star Café), một công ty địa phương có thể sử dụng "ủy
quyền chiến lược" (ví dụ David ủy quyền cho Rachel) để cam kết một chiến
lược quyết liệt, khiến đối thủ lớn (Star Café) phải suy nghĩ lại việc gia nhập.
§ Trò chơi lặp lại
của OPEC (Iran và Venezuela) cho thấy:
§ Nếu có thời hạn trò chơi cố định, quy nạp ngược dẫn đến việc
các quốc gia gian lận trong mỗi giai đoạn.
§ Nếu không có thời hạn cố định, khả năng hợp tác lâu dài phụ
thuộc vào "hệ số chiết khấu" (mức độ kiên nhẫn của các quốc gia).
Quốc gia càng kiên nhẫn (hệ số chiết khấu cao), càng có khả năng hợp tác vì giá
trị lợi ích tương lai được đánh giá cao hơn.
§ Khái niệm này cũng được áp dụng để phân tích văn hóa
chính trị và vòng lặp bảo trợ giữa các chính đảng, nơi sự hợp tác có thể tự
duy trì nếu nó mang lại lợi ích dài hạn tốt hơn cho tất cả các bên so với hành
vi không hợp tác.
5.
Trò chơi
thông tin không đầy đủ / không đối xứng (Games of Incomplete / Asymmetric
Information)
o Khái niệm:
Xảy ra khi một người chơi có nhiều thông tin hơn người kia. Các chiến lược
trong những trò chơi này được phân tích bằng Cân bằng Nash Bayesian hoàn hảo
(Perfect Bayesian Nash Equilibrium - PBNE), trong đó người chơi cập nhật
niềm tin của mình dựa trên các hành động được quan sát.
o Trò chơi ra tín hiệu (Signaling Games): Người chơi có thông tin nhiều hơn (người gửi tín hiệu) hành
động để truyền đạt thông tin đó một cách đáng tin cậy cho người chơi ít thông
tin hơn (người nhận).
§ Ứng dụng:
Edward Smythe cải trang thành lính canh để tránh Jack điên loạn. Trang phục
lính canh của Edward là một tín hiệu. Tín hiệu này phải đủ tốn kém và thuyết
phục để Jack tin rằng Edward thực sự là lính canh, khiến Jack do dự khi tấn
công.
o Trò chơi sàng lọc (Screening Games): Người chơi có ít thông tin hơn (người sàng lọc) thiết kế
các cơ chế hoặc chuỗi đề nghị để khơi gợi thông tin từ người chơi có nhiều
thông tin hơn.
§ Ứng dụng:
Margaret, nhân viên môi giới bất động sản, sử dụng chiến lược định giá và tặng
voucher để sàng lọc người mua có ngân sách cao hoặc thấp, nhằm tối đa hóa lợi
nhuận khi bán nhà cho Ethan. Người mua tự bộc lộ mức sẵn lòng chi trả thông qua
phản ứng của họ với các đề nghị. Các gói bảo hiểm cũng là một ví dụ, nơi các
công ty đưa ra nhiều lựa chọn để sàng lọc khách hàng có rủi ro khác nhau.
Những khái niệm này, từ chiến lược trội đến cân bằng Nash
Bayesian hoàn hảo, đều được lý thuyết trò chơi sử dụng để phân tích và dự đoán
hành vi trong các tình huống tương tác chiến lược phức tạp, từ những quyết định
đời thường cho đến các chiến lược kinh doanh và chính trị.
2. Cuốn sách
này khác biệt thế nào trong cách tiếp cận lý thuyết trò chơi so với các tài
liệu khác?
Cuốn sách "Lý thuyết trò chơi: Giới thiệu rất ngắn gọn
và dễ hiểu" của Nejat Anbarci và Kemal Kıvanç Aköz có một cách tiếp cận
khác biệt đáng kể so với nhiều tài liệu khác về lý thuyết trò chơi, đặc biệt là
các văn bản học thuật truyền thống.
Dưới đây là những điểm khác biệt chính trong cách tiếp cận
của cuốn sách này:
1.
Dễ tiếp cận,
lôi cuốn và giải trí, tránh xa sự trừu tượng phức tạp:
o Cuốn sách này được thiết kế để dễ tiếp cận, lôi cuốn và
giải trí, một điều hiếm thấy trong một lĩnh vực thường bị chi phối bởi các
phương trình và sự trừu tượng.
o Nó không phải là một cuốn sách học thuật điển hình với những
phương trình phức tạp và biệt ngữ đáng sợ. Thay vào đó, mục tiêu là giúp
độc giả hiểu lý thuyết trò chơi mà không cần bằng cấp cao về toán học hoặc cảm
thấy bị choáng ngợp bởi các công thức dày đặc.
o Cuốn sách trình bày những ý tưởng nghiêm túc với sự phụ
thuộc tối thiểu vào các biểu thức toán học, chỉ lồng ghép các phép tính cơ
bản khi cần thiết.
2.
Phương pháp
kể chuyện và ví dụ thực tế:
o Điểm đặc biệt của cuốn sách là sự phụ thuộc vào các câu
chuyện. Các tác giả tin rằng cách tốt nhất để hiểu lý thuyết là nhìn thấy
nó trong thực tế.
o Thông qua những câu chuyện sống động, những ví dụ sâu sắc
và một chút hài hước, lý thuyết trò chơi được làm cho sống động, giúp các ý
tưởng phức tạp trở nên dễ tiếp cận với nhiều đối tượng độc giả.
o Cuốn sách sử dụng các ví dụ thực tế và sống động để giải
thích các khái niệm trừu tượng, từ quả phạt đền hụt của Roberto Baggio, các
bước đi chiến lược của OPEC, đến những ý nghĩa triết học trong phim Ma trận.
3.
Hình minh
họa vui nhộn và yếu tố giải trí:
o Những hình minh họa thú vị được thêm vào để tăng thêm
sự vui nhộn.
o Nó còn lồng ghép những mẩu tin thú vị, như số Erdős của các
tác giả, vào các hình ảnh quyến rũ của cuốn sách.
4.
Cấu trúc sư
phạm rõ ràng và bao quát các khái niệm:
o Cuốn sách dẫn dắt người đọc một cách cẩn thận, bắt đầu từ
các mô hình lý thuyết trò chơi cổ điển và hiện đại đơn giản như Thế tiến thoái
lưỡng nan của người tù, đấu giá, trò chơi đoán, và chuyển sang các khái niệm
phức tạp hơn như cân bằng trong các trò chơi với thông tin không hoàn hảo.
o Lối trình bày này phản ánh cấu trúc của một khóa học lý
thuyết trò chơi ở cấp độ sau đại học, làm cho cuốn sách có giá trị ngay cả đối
với các sinh viên cao cấp.
5.
Ghi nhận hạn
chế và kết nối với Kinh tế học hành vi:
o Khác với việc trình bày lý thuyết trò chơi như một giải pháp
phổ quát, cuốn sách này thể hiện sự khiêm tốn về mặt trí tuệ bằng cách
thừa nhận những hạn chế của nó.
o Nó nhận ra rằng các quyết định trong cuộc sống thực hiếm khi
được đưa ra bởi những người chơi hoàn toàn hợp lý, vị kỷ, vì cảm xúc, sự
công bằng và tính ngẫu nhiên thường đóng vai trò quan trọng.
o Trong bối cảnh này, cuốn sách khám phá các chủ đề nâng cao
như mô hình hệ thống phân cấp nhận thức và kinh tế học hành vi, giúp kiểm soát
lý thuyết trò chơi bằng cách cho thấy quan điểm lạnh lùng, hợp lý có thể sai
lầm đến mức nào.
Tóm lại, cách tiếp cận của cuốn sách này nhấn mạnh vào việc
làm cho lý thuyết trò chơi trở nên dễ hiểu, hấp dẫn và liên quan đến đời sống
thực, thông qua việc kể chuyện và các ví dụ cụ thể, đồng thời giảm thiểu sự phụ
thuộc vào toán học phức tạp, và còn thẳng thắn nhìn nhận những hạn chế của lý
thuyết trong việc giải thích hành vi con người.
3. So sánh và đối chiếu các cơ chế của "Đấu
giá bỏ thầu kín theo giá thứ hai" với "Cạnh tranh Bertrand".
Phân tích cách mỗi cơ chế thúc đẩy các chiến lược khác nhau ở người chơi và
những kết quả cân bằng tương ứng của chúng.
Cuốn sách đã so sánh và đối chiếu hai cơ chế "Đấu
giá bỏ thầu kín theo giá thứ hai" và "Cạnh tranh
Bertrand" trong lý thuyết trò chơi, đồng thời phân tích cách mỗi cơ
chế thúc đẩy các chiến lược khác nhau ở người chơi và những kết quả cân bằng
tương ứng của chúng.
Cả hai đều là các mô hình lý thuyết trò chơi cổ điển liên
quan đến các tương tác chiến lược và đều tìm kiếm cân bằng Nash,
một trạng thái mà không người chơi nào có thể đạt được lợi ích bằng cách đơn
phương thay đổi chiến lược của mình, dựa trên những gì người khác đang làm.
Dưới đây là so sánh và đối chiếu cụ thể:
1. Đấu giá
bỏ thầu kín theo giá thứ hai
- Cơ chế và Quy tắc:
- Trong cơ chế này, thay vì hô to giá thầu như trong đấu
giá công khai, mỗi người mua bí mật viết giá thầu của mình và niêm
phong nó trong một phong bì.
- Người điều hành đấu giá sau đó trao giải thưởng cho người
trả giá cao nhất nhưng yêu cầu người đó chỉ phải trả mức giá cao thứ hai.
- Trò chơi này là một trò chơi tĩnh, nơi những
người ra quyết định di chuyển đồng thời hoặc không biết những người khác
đã chọn gì. Ai gửi giá thầu trước không quan trọng vì một khi giá thầu
được tiết lộ, không ai có thể làm lại.
- Chiến lược của người chơi:
- Đối với người tham gia đấu giá, chiến lược trội
(chiến lược đảm bảo kết quả tốt hơn, bất kể đối thủ làm gì) là trả giá
đúng giá trị tối đa thực sự của mình.
- Cuốn sách giải thích rằng trả giá cao hơn giới hạn của
bản thân là một ý tưởng tồi, trong khi trả giá thấp hơn giới hạn có thể
khiến người chơi mất cơ hội khi đáng lẽ không phải vậy. Do đó, lựa chọn
tốt nhất của mỗi người chơi là trả giá đúng mức mà họ thực sự sẵn lòng
trả.
- Kết quả cân bằng:
- Kết quả cân bằng là người sẵn lòng trả giá cao nhất sẽ
thắng, nhưng họ chỉ phải trả gần bằng giá thầu cao thứ hai.
- Mặc dù Hội đồng thành phố London sẵn sàng chi 200.000
bảng Anh cho bản thảo Shakespeare, ông Smith chỉ phải trả 175.500 bảng
Anh (là giá thầu cao thứ hai), vì ông là người trả giá cao nhất.
- Thu thập thông tin:
- Một điểm khác biệt quan trọng là trong đấu giá giá thứ
hai, người điều hành đấu giá biết chính xác những gì mọi người sẵn
lòng trả, điều này có thể có giá trị cho một số mục đích nhất định.
2. Cạnh
tranh Bertrand
- Cơ chế và Quy tắc:
- Cạnh tranh Bertrand là một trò chơi trong đó hai
công ty bán cùng một sản phẩm (hoặc rất giống nhau) cho cùng một loại
người mua trong cùng một thị trường, và họ cạnh tranh bằng cách đồng
thời đưa ra mức giá.
- Trò chơi này cũng là một trò chơi tĩnh.
- Giả định rằng các công ty có chi phí sản xuất giống
nhau.
- Chiến lược của người chơi:
- Chiến lược chính trong cạnh tranh Bertrand là giảm
giá. Nếu một công ty dự kiến các đối thủ sẽ chọn một mức giá cao hơn
chi phí, công ty đó có thể giảm giá một chút để chiếm lĩnh toàn bộ thị
trường.
- Sự cám dỗ để giảm giá là một chiến lược chiếm ưu
thế. Mỗi công ty sẽ liên tục hạ giá để thu hút khách hàng.
- Kết quả cân bằng:
- Trong cân bằng Nash của trò chơi này, giá cân bằng
bằng với chi phí sản xuất.
- Câu chuyện về Alice và Ben cho thấy cả hai cửa hàng sẽ
tiếp tục giảm giá cho đến khi họ không kiếm được bất kỳ lợi nhuận nào
trên mỗi lần bán (giá bằng 100 bảng Anh, bằng với chi phí từ nhà bán buôn
cộng các chi phí khác).
- Nếu một trong hai công ty có lợi thế chi phí nhỏ, công
ty có chi phí thấp hơn sẽ giành chiến thắng, và công ty kia sẽ phải từ
bỏ.
- Nếu các công ty có thể tin tưởng lẫn nhau, họ có thể
đồng ý định giá cao hơn, nhưng lòng tin rất khó thiết lập, và cám
dỗ để gian lận bằng cách giảm giá sẽ dẫn đến kết quả giống như Thế tiến
thoái lưỡng nan của tù nhân.
3. So sánh
và Đối chiếu
Điểm tương đồng:
- Cả hai đều là các trò chơi tĩnh nơi người chơi đưa ra
quyết định đồng thời hoặc không biết lựa chọn của người khác.
- Cả hai đều có chiến lược trội định hướng hành vi
của người chơi và dẫn đến một kết quả cân bằng cụ thể.
- Cả hai đều có thể được phân tích bằng cách sử dụng công
cụ cân bằng Nash.
- Cả hai đều minh họa các tình huống tương tác chiến lược
trong kinh tế học.
Điểm khác biệt:
- Mục tiêu chính:
Đấu giá giá thứ hai tập trung vào việc bán một mặt hàng cho người
trả giá cao nhất, trong khi cạnh tranh Bertrand tập trung vào việc định
giá sản phẩm để giành thị phần trong một thị trường cạnh tranh.
- Hành động của người chơi: Trong đấu giá, người chơi đưa ra giá thầu.
Trong cạnh tranh Bertrand, người chơi đưa ra giá bán.
- Kết quả mong muốn của người chơi: Trong đấu giá, người mua muốn có được món đồ với giá
tốt nhất có thể (không vượt quá giá trị thực của họ). Trong cạnh tranh
Bertrand, các công ty muốn tối đa hóa lợi nhuận hoặc thị phần.
- Kết quả cân bằng:
Trong đấu giá giá thứ hai, người thắng cuộc trả giá thầu cao thứ hai.
Trong cạnh tranh Bertrand, giá cân bằng sẽ giảm xuống bằng chi phí sản
xuất, dẫn đến lợi nhuận kinh tế gần bằng không cho các công ty.
- Thông tin thu thập được: Đấu giá giá thứ hai giúp người điều hành đấu giá biết
được giá trị thực của người trả giá. Cạnh tranh Bertrand chỉ cung cấp
thông tin về giá cuối cùng trên thị trường.
- "Thất bại" của hợp tác: Cạnh tranh Bertrand là một ví dụ rõ ràng về việc sự
hợp tác giữa các công ty (để giữ giá cao hơn) khó khăn như thế nào do cám
dỗ giảm giá, tương tự như Thế tiến thoái lưỡng nan của tù nhân. Đấu giá
giá thứ hai không có yếu tố "hợp tác" giữa những người mua theo
cách tương tự, vì mục tiêu là cá nhân giành được món đồ.
- Bản chất của chiến lược trội: Trong đấu giá giá thứ hai, chiến lược trội là trung
thực (bidding one's true valuation). Trong cạnh tranh Bertrand, chiến
lược cạnh tranh là giảm giá để giành thị phần, dẫn đến kết quả
không lý tưởng cho tất cả các công ty nếu họ đã hợp tác.
Tóm lại, cả hai cơ chế đều là những mô hình quan trọng trong
lý thuyết trò chơi để phân tích các tương tác chiến lược. Đấu giá giá thứ hai
khuyến khích sự trung thực của người trả giá và là một công cụ hiệu quả để khám
phá giá trị thực, trong khi cạnh tranh Bertrand minh họa cách sự cạnh tranh về
giá có thể làm giảm lợi nhuận xuống mức chi phí, ngay cả với chỉ hai công ty.
4. Khám phá ý nghĩa của "quy nạp ngược"
và "cân bằng Nash hoàn hảo của trò chơi con" trong các trò chơi động.
Sử dụng ví dụ về "phòng đàm phán" (chủ nhà và người thuê) để minh họa
cách các mối đe dọa không đáng tin cậy bị loại bỏ và hành vi hợp lý được hình
thành.
Trong các trò chơi động, khái niệm "quy nạp
ngược" (backward induction) và "cân bằng Nash hoàn hảo của trò
chơi con" (subgame perfect Nash equilibrium - SPNE) là những công cụ
then chốt để phân tích hành vi hợp lý của người chơi và dự đoán kết quả.
1. Trò chơi
động và Quy nạp ngược
- Trò chơi động
là những trò chơi mà người chơi hành động lần lượt, quan sát các nước đi
của nhau, hoặc ít nhất là nhận được một số thông tin liên quan đến các
nước đi đó. Điều này khác với các trò chơi tĩnh, nơi những người ra quyết
định di chuyển đồng thời hoặc không biết những người khác đã chọn gì (ví
dụ: đấu giá bỏ thầu kín giá thứ hai).
- Quy nạp ngược
là một phương pháp được sử dụng trong các trò chơi dạng mở rộng hữu hạn để
xác định các chiến lược cân bằng. Phương pháp này hoạt động bằng cách bắt
đầu từ nút quyết định cuối cùng của trò chơi và làm việc ngược lại từng
bước đến giai đoạn đầu tiên. Ở mỗi bước, những quyết định tồi sẽ bị loại
bỏ và chỉ giữ lại những phản ứng tốt nhất.
- Quy nạp ngược cho phép những người chơi đi nước đầu
tiên dự đoán chính xác các diễn biến trong tương lai và hình thành kỳ vọng
của họ một cách phù hợp.
2. Cân bằng
Nash hoàn hảo của trò chơi con (SPNE)
- Trò chơi con
là một phần của trò chơi dạng mở rộng, bắt đầu từ một lịch sử cụ thể và
bao gồm tất cả các hành động tiếp theo, người chơi đưa ra quyết định, và
các kết quả và lịch sử phát sinh. Trò chơi con này được nhúng bên trong
trò chơi dạng mở rộng lớn hơn.
- Cân bằng Nash hoàn hảo của trò chơi con (SPNE) là một danh sách chiến lược trong một trò chơi dạng mở
rộng, trong đó chiến lược đó tạo thành một cân bằng Nash trong mọi trò
chơi con của trò chơi. Điểm khác biệt chính giữa SPNE và cân bằng Nash
tiêu chuẩn là SPNE yêu cầu người chơi phải đưa ra phản ứng tốt nhất có thể
trong mọi kịch bản có thể xảy ra. Điều này có nghĩa là các chiến
lược liên quan đến các mối đe dọa không đáng tin cậy sẽ bị loại bỏ.
- Trong các trò chơi động, SPNE được tính bằng cách sử
dụng quy nạp ngược. Nó là một trong những khái niệm thường được dùng nhất
trong trò chơi động và là phương pháp then chốt để tính toán.
3. Ví dụ về
"Phòng đàm phán" (Chủ nhà và Người thuê)
Ví dụ về cuộc đàm phán tiền thuê nhà giữa bà Walker (chủ
nhà) và Tom & Sarah (người thuê) minh họa rõ ràng cách quy nạp ngược giúp
loại bỏ các mối đe dọa không đáng tin cậy và định hình hành vi hợp lý.
- Tình huống ban đầu:
Tom và Sarah là những người thuê nhà mẫu mực, trả 1.000 bảng Anh/tháng.
Tuy nhiên, do lạm phát, bà Walker yêu cầu mức tăng đột biến lên 2.000 bảng
Anh/tháng, cao hơn giá thị trường, đồng thời đưa ra lời đe dọa: nếu họ
không chấp nhận, bà sẽ yêu cầu họ rời đi và đưa ra tòa nếu cần. Tom và
Sarah từ chối lời đề nghị này, khẳng định họ không thể chấp nhận mức tăng
đó.
- Phân tích mối đe dọa không đáng tin cậy:
- Lời đe dọa của bà Walker: Bà đe dọa sẽ yêu cầu Tom và Sarah rời đi nếu họ không
chấp nhận mức 2.000 bảng Anh.
- Tính không đáng tin cậy: Sarah, với tư cách là một người thuê nhà thông minh,
nhận ra rằng lời đe dọa của bà Walker là "không đáng tin
cậy" (incredible threat). Mối đe dọa không đáng tin cậy là một
tình huống trong đó chiến lược của người chơi không bao gồm phản ứng tốt
nhất trong một kịch bản tương lai. Người chơi khác mong đợi người chơi đó
sẽ đi chệch khỏi chiến lược đó.
- Áp dụng quy nạp ngược:
- Sarah suy nghĩ từ cuối trò chơi: Nếu cô ấy từ chối
mức 2.000 bảng Anh, bà Walker sẽ có hai lựa chọn: thực hiện lời đe dọa
(đuổi họ ra và tìm người thuê mới) hoặc đưa ra một đề nghị hợp lý hơn.
- Việc tìm người thuê mới sẽ tốn kém ($c_s > 0$), và
việc kiện tụng cũng gây ra rắc rối.
- Nếu bà Walker đưa ra một đề nghị khác là 1.500 bảng
Anh (một mức tăng hợp lý hơn so với giá thị trường), Sarah chắc chắn sẽ
chấp nhận thay vì chuyển đi.
- Khi bà Walker hiểu rằng nếu bà yêu cầu họ rời đi, bà
phải tìm kiếm những người thuê nhà mới, tốn kém hơn so với việc chấp
nhận mức 1.500 bảng Anh, lựa chọn tốt nhất của bà là đề nghị 1.500
bảng Anh.
- Vì vậy, lời đe dọa ban đầu của bà Walker là không
đáng tin cậy, bởi vì khi thực hiện, việc yêu cầu họ rời đi không phải là
lựa chọn tốt nhất của bà.
- Hình thành hành vi hợp lý:
- Tom và Sarah, biết được điều này qua quy nạp ngược, có
thể tự tin từ chối mức tăng 2.000 bảng Anh vì họ hiểu rằng bà Walker sẽ
không thực hiện lời đe dọa của mình.
- Bà Walker, sau khi nhận ra sự không hợp lý trong lời
đề nghị và mối đe dọa của mình, đã liên hệ lại với Tom và Sarah để gặp
mặt. Bà hiểu rằng việc tăng 100% là không thể và đã đưa ra đề nghị thỏa
hiệp là 1.500 bảng Anh.
- Tom và Sarah, thấy rằng đây là mức tăng cao nhất mà họ
sẽ chấp nhận mà không phản đối, đã đồng ý.
Kết quả là, nhờ quy nạp ngược, lời đe dọa không đáng tin cậy
của bà Walker đã bị loại bỏ khỏi các chiến lược cân bằng. Thay vào đó, cả hai
bên đều tiến tới một SPNE, nơi mỗi nước đi là phản ứng tốt nhất trong mọi kịch
bản có thể xảy ra, dẫn đến một kết quả hợp lý hơn cho cả hai bên: mức tăng 50%
tiền thuê. Điều này cho thấy tầm quan trọng của việc suy nghĩ trước và loại bỏ
những lời đe dọa không thể đứng vững trước sự xem xét kỹ lưỡng trong các trò
chơi động.
5. Đánh giá tác động của thông tin không đối xứng
trong lý thuyết trò chơi bằng cách phân tích "trò chơi ra tín hiệu"
và "trò chơi sàng lọc". Giải thích cách các bên tìm cách khắc phục
lợi thế thông tin của nhau và những ứng dụng thực tế của các trò chơi này trong
kinh tế hoặc kinh doanh.
Trong lý thuyết trò chơi, thông tin không đối xứng
xảy ra khi một người chơi có nhiều thông tin hơn những người khác, tạo ra lợi
thế chiến lược đáng kể. Để khắc phục sự mất cân bằng này, các bên thường sử
dụng "trò chơi ra tín hiệu" và "trò chơi sàng lọc" như
những công cụ mạnh mẽ để điều chỉnh kỳ vọng và đạt được kết quả hợp lý. Cả hai
loại trò chơi này đều dựa trên khái niệm cân bằng Nash Bayesian hoàn hảo
(Perfect Bayesian Nash Equilibrium - PBNE), nơi các chiến lược của người chơi
phải phù hợp với niềm tin của họ, và niềm tin đó được cập nhật bằng cách sử
dụng nguyên lý Bayes.
1. Trò chơi
ra tín hiệu (Signaling Games)
Mô tả: Trong trò
chơi ra tín hiệu, một người chơi (người gửi tín hiệu) nắm giữ thông tin riêng
tư (thông tin không đầy đủ) và tìm cách truyền đạt thông tin này cho người chơi
khác (người nhận tín hiệu) thông qua các hành động của mình. Người nhận tín
hiệu, không có thông tin ban đầu, phải suy luận về thông tin riêng tư của người
gửi dựa trên tín hiệu mà người gửi đưa ra.
Ví dụ "Edward Smythe":
- Tình huống:
Edward Smythe, một quý ông London, muốn đến thăm chú mình nhưng phải đi
qua một con hẻm có Jack điên loạn, một tên côn đồ chuyên hành hung quý
ông. Edward biết mình là một quý ông, nhưng Jack không biết liệu Edward có
phải là một "lính canh" (lính cứu hỏa mạnh mẽ) hay không.
- Thông tin không đối xứng: Edward có thông tin riêng tư về bản chất yếu đuối của
mình, còn Jack không có thông tin đó. Jack chỉ biết Edward có thể là một
quý ông dễ bị tấn công hoặc một lính canh nguy hiểm.
- Hành động ra tín hiệu: Edward quyết định cải trang thành một lính canh để gửi
tín hiệu cho Jack rằng anh ta không phải là mục tiêu dễ dàng. Anh ta mua
một chiếc áo khoác, mũ lưỡi trai, ủng và thậm chí cả dùi cui để trông
thuyết phục. Anh ta cũng bắt chước dáng đi và cử chỉ của lính canh.
- Tác động của tín hiệu: Jack điên loạn, sau khi bị Tom "Bones"
Riddley (một lính canh thực sự) đánh bại, trở nên thận trọng hơn và tránh
gây sự với những người trông giống lính canh. Edward dựa vào sự ác cảm rủi
ro này của Jack. Tín hiệu của Edward thành công vì Jack nhận thấy chi phí
để tấn công một lính canh tiềm năng (dù đó chỉ là Edward cải trang) là quá
cao. Jack chấp nhận tín hiệu và để Edward đi qua.
- Đặc điểm của tín hiệu hiệu quả: Một tín hiệu phải đủ "tốn kém" để không dễ
dàng bị giả mạo. Nếu việc cải trang dễ dàng, tất cả quý ông sẽ cải trang,
làm mất đi hiệu quả của tín hiệu.
Ứng dụng thực tế:
- Ngăn chặn gia nhập thị trường: Một nhà độc quyền có thể giữ giá thấp để báo hiệu cho
các đối thủ cạnh tranh tiềm năng rằng chi phí sản xuất của họ thấp, khiến
các đối thủ e ngại gia nhập thị trường.
- Giáo dục và bằng cấp:
Sinh viên theo đuổi bằng cấp đại học, một phần, để báo hiệu cho nhà tuyển
dụng tiềm năng về khả năng giải quyết công việc phức tạp của họ. Tín hiệu
này chỉ có giá trị nếu việc lấy bằng đòi hỏi nỗ lực và chi phí đáng kể.
2. Trò chơi
sàng lọc (Screening Games)
Mô tả: Trong trò
chơi sàng lọc, người chơi có ít thông tin hơn (người sàng lọc) thiết kế một cơ
chế hoặc một chuỗi các đề nghị để khiến người chơi có nhiều thông tin hơn
(người được sàng lọc) tự tiết lộ thông tin riêng tư của mình. Người sàng lọc
sau đó sẽ cập nhật niềm tin của mình dựa trên phản ứng của người được sàng lọc.
Ví dụ "Bán nhà của Ethan":
- Tình huống:
Ethan cần bán nhà của ông mình và nhờ Margaret, một nhân viên môi giới,
giúp đỡ. Margaret không biết ngân sách tối đa thực sự của những người mua
tiềm năng.
- Thông tin không đối xứng: Người mua (ví dụ Helen Davies) biết mức giá tối đa họ
sẵn lòng trả (£500,000), nhưng Margaret (người bán) không có thông tin
này.
- Hành động sàng lọc:
Margaret biết rằng thị trường đang trầm lắng và có hai nhóm người mua:
nhóm sẵn sàng trả £500,000 và nhóm chỉ trả £400,000. Ethan cần bán nhà
trong vòng một năm, và nếu không bán được, giá sẽ phải giảm xuống
£400,000.
- Margaret nhận ra rằng nếu niêm yết giá £500,000 ngay,
những người mua sẵn lòng trả £500,000 có thể chờ đến năm sau để mua với
giá £400,000 (tiết kiệm £100,000, tương đương £80,000 giá trị hiện tại
với lãi suất 25%).
- Để khuyến khích người mua có ngân sách cao mua ngay,
Margaret tính toán rằng mức giá hiệu quả là £420,000 (tức là £400,000
cộng thêm £20,000, khoản chênh lệch mà người mua sẵn lòng trả để không
phải chờ một năm, nếu họ thực sự sẵn lòng trả £500,000).
- Ngoài ra, Margaret còn đưa ra một voucher £500 để mua
sắm nội thất như một "chất xúc tác" nhỏ để người mua quyết định
nhanh chóng.
- Tác động của sàng lọc: Bằng cách đưa ra một mức giá và ưu đãi được thiết kế
cẩn thận, Margaret đã thành công trong việc khiến Helen (người sẵn lòng
trả £500,000) tự tiết lộ thông tin về mức ngân sách cao hơn của mình bằng
cách chấp nhận đề nghị £420,000. Chiến lược này cho phép người bán thu
được lợi nhuận cao hơn so với việc niêm yết giá thấp ngay lập tức, đồng
thời vẫn chốt được giao dịch.
Ứng dụng thực tế:
- Đấu giá giá thầu thứ hai (Second-price auction): Loại đấu giá này (được thảo luận trong Chương 5) cho
phép người bán biết chính xác mức tối đa mà mỗi người mua sẵn lòng trả,
mặc dù người thắng cuộc chỉ phải trả bằng giá thầu cao thứ hai.
- Gói bảo hiểm:
Các công ty bảo hiểm đưa ra nhiều lựa chọn hợp đồng khác nhau để phân loại
khách hàng có rủi ro cao và rủi ro thấp. Thông qua lựa chọn của khách hàng,
công ty bảo hiểm thu thập thông tin về rủi ro của từng cá nhân và tối đa
hóa lợi nhuận.
- Chiến lược định giá theo thời gian: Các doanh nghiệp thường điều chỉnh giá theo thời gian
để khuyến khích các phân khúc khách hàng khác nhau mua hàng, từ những người
mua sẵn sàng trả cao để có sản phẩm sớm đến những người kiên nhẫn chờ đợi
giảm giá.
Tác động của
thông tin không đối xứng
Thông tin không đối xứng có tác động sâu sắc đến các tương
tác chiến lược, buộc người chơi phải phát triển các chiến lược tinh vi để hoặc tiết
lộ thông tin của mình (trong trò chơi ra tín hiệu) hoặc thu thập thông
tin từ người khác (trong trò chơi sàng lọc).
- Hình thành kỳ vọng và loại bỏ mối đe dọa không đáng tin
cậy: Cả hai loại trò chơi này đều
sử dụng logic của quy nạp ngược và cân bằng Nash Bayesian hoàn hảo để giúp
người chơi hình thành kỳ vọng về hành vi của nhau, loại bỏ các mối đe dọa
không đáng tin cậy hoặc các chiến lược không nhất quán.
- Hiệu quả và phân bổ nguồn lực: Bằng cách giải quyết vấn đề thông tin không đối xứng,
các trò chơi này giúp đạt được các kết quả hiệu quả hơn, từ việc ngăn chặn
xung đột không cần thiết đến tối ưu hóa doanh thu trong kinh doanh hoặc
đảm bảo sự công bằng trong các hệ thống.
- Định hình hành vi:
Thông tin không đối xứng buộc người chơi phải cân nhắc kỹ lưỡng hơn các
nước đi của mình, dự đoán phản ứng của đối phương và tính đến chi phí/lợi
ích của việc truyền đạt hoặc thu thập thông tin. Nó làm nổi bật sự phức
tạp của việc ra quyết định trong thế giới thực, nơi không phải lúc nào mọi
thứ cũng rõ ràng và minh bạch.
Tóm lại, trò chơi ra tín hiệu và sàng lọc là những minh
chứng điển hình cho việc thông tin không đối xứng định hình các tương tác chiến
lược như thế nào, thúc đẩy người chơi sử dụng các phương pháp phức tạp để vượt
qua lợi thế thông tin của nhau và đạt được các kết quả hợp lý.
.gif)
.jpg)
