Nguồn gốc đằng sau sự thông minh của ChatGPT xuất phát từ một cuộc tranh luận năm 1906

Cre: Dev life


Ít ai biết rằng đằng sau sự thông minh vượt bậc của ChatGPT hay các mô hình trí tuệ nhân tạo hiện đại lại là một cuộc tranh luận nảy lửa từ tận năm 1906. Một nhà toán học người Nga tên là Andrey Markov đã đặt nền móng cho AI chỉ vì muốn phản bác một linh mục trong một cuộc đối đầu học thuật đầy kịch tính.

Bản chất của cuộc tranh luận này nằm ở quan điểm của Pavel Nekrasov, một linh mục đồng thời là nhà toán học tài năng. Nekrasov tin rằng các con số và xác suất có thể chứng minh thiết kế vĩ đại của Chúa. Ông lập luận rằng Luật số lớn (Law of Large Numbers) chỉ hoạt động khi các sự kiện hoàn toàn độc lập với nhau, giống như việc tung đồng xu mà kết quả lần này không hề ảnh hưởng đến lần sau.

Theo lý giải của Nekrasov, nếu các quyết định của con người tuân theo mô hình xác suất này, thì con người phải có những lựa chọn tự do và độc lập. Từ đó, ông dùng toán học để cố gắng chứng minh sự tồn tại của ý chí tự do, linh hồn và gián tiếp khẳng định quyền năng của Thiên Chúa trong việc sắp đặt trật tự thế giới thông qua các biến số độc lập.

Andrey Markov, một người vô thần quyết liệt và nổi tiếng với tính cách thẳng thắn, đã cảm thấy bị xúc phạm sâu sắc bởi cách Nekrasov lạm dụng các định lý toán học để phục vụ cho mục đích tôn giáo. Để đập tan lập luận của đối thủ, Markov quyết tâm chứng minh rằng Luật số lớn không nhất thiết cần đến sự độc lập giữa các biến số.

Ông chỉ ra rằng các giá trị trung bình vẫn có thể đạt được trạng thái ổn định ngay cả khi mọi sự kiện đều kết nối và phụ thuộc chặt chẽ vào sự kiện đứng trước nó. Qua đó, Markov muốn khẳng định rằng ý chí tự do hay linh hồn không hề liên quan đến tính quy luật của toán học. Mọi hệ thống, dù có sự liên kết dữ liệu hay không, đều phải tuân theo những định luật xác suất khách quan.

Để chứng minh luận điểm của mình một cách thuyết phục nhất, Markov đã thực hiện một phương pháp vô cùng thủ công nhưng đầy thiên tài. Ông lấy cuốn tiểu thuyết thơ nổi tiếng Eugene Onegin của đại thi hào Pushkin và tự tay đếm 20.000 ký tự đầu tiên. Ông tỉ mỉ thống kê tỉ lệ các nguyên âm xuất hiện sau các phụ âm và ngược lại.

Kết quả thống kê cho thấy các ký tự trong ngôn ngữ không hề xuất hiện ngẫu nhiên. Chúng phụ thuộc chặt chẽ vào cấu trúc của ký tự ngay trước đó. Từ nghiên cứu thực tiễn này, khái niệm Chuỗi Markov (Markov Chain) chính thức ra đời. Nguyên lý cơ bản của nó chỉ ra rằng: Trạng thái tiếp theo của một hệ thống chỉ phụ thuộc vào trạng thái hiện tại, chứ không phụ thuộc vào toàn bộ lịch sử xa xôi trước đó.

Nguyên lý Chuỗi Markov chính xác là cách mà các mô hình ngôn ngữ lớn (LLM) như GPT-4 hay Claude đang vận hành ngày nay. Khi bạn thấy ChatGPT phản hồi từng chữ trên màn hình, thực chất nó đang thực hiện một phiên bản nâng cấp cực kỳ phức tạp của việc đếm chữ mà Markov đã làm cách đây hơn một thế kỷ.

AI hiện đại không thực sự hiểu ý nghĩa theo cách của con người, mà nó tính toán xác suất để dự đoán xem từ (hoặc cụm từ) nào có khả năng xuất hiện tiếp theo cao nhất dựa trên ngữ cảnh hiện tại. Nếu Markov dùng xác suất để dự đoán sự luân phiên giữa nguyên âm và phụ âm, thì AI ngày nay dùng hàng nghìn tỷ tham số để dự đoán sự liên kết giữa các khái niệm ngôn ngữ phức tạp.

Andrey Markov qua đời vào năm 1922 mà không hề hay biết rằng cuộc tranh cãi nảy lửa của mình với vị linh mục năm xưa đã vô tình tặng cho nhân loại công cụ quan trọng nhất của kỷ nguyên số. Đây là một ví dụ điển hình cho việc cảm hứng sáng tạo và những phát kiến vĩ đại đôi khi không đến từ những mục tiêu cao siêu ban đầu, mà đến từ những mâu thuẫn cá nhân và khát khao bảo vệ sự khách quan của khoa học.

Ngày nay, mỗi khi sử dụng AI để dịch thuật hay giải đáp thắc mắc, chúng ta thực chất đang thừa hưởng thành quả từ nỗ lực phản bác một lập luận tôn giáo của nhà toán học người Nga từ hơn 100 năm trước.

Đăng nhận xét

Mới hơn Cũ hơn