🔙 Quay lại trang tải sách pdf ebook Tạp Chí Epsilon Số 6
Ebooks
Nhóm Zalo
THÁNG 12
Chủ biên:
TRẦN NAM DŨNG
Biên tập viên:
VÕ QUỐC BÁ CẨN
TRẦN QUANG HÙNG NGUYỄN VĂN HUYỆN NGUYỄN TIẾN LÂM
LÊ PHÚC LỮ
NGUYỄN TẤT THU
ĐẶNG NGUYỄN ĐỨC TIẾN
LỜI NGỎ CHO EPSILON SỐ 6
Ban Biên tập Epsilon
Cuối cùng số 6 của Tạp chí Epsilon cũng đã đến tay các bạn. Số 6 của năm đầu tiên.
Bắt đầu từ ngày 13/2/2015, rồi đến hẹn lại lên, cứ vào ngày 13 của những tháng chẵn, Epsilon-tạp chí online của những người yêu toán lại được ra mắt hàng trăm, hàng ngàn độc giả.
Và để có được sự đều đặn với nội dung ngày càng phong phú và hình thức ngày càng đẹp hơn như hiện nay là sự nỗ lực của cả một tập thể: từ những người viết bài đến các biên tập viên. Tất cả đều làm việc trên tinh thần tự nguyện và mong muốn đóng góp cho cộng đồng.
Đặc biệt, dù hoàn toàn dựa trên tinh thần tự nguyên, không có quyền lợi vật chất, cũng như bất cứ ràng buộc pháp lý nào nhưng tất cả mọi người đều làm việc với tinh thần trách nhiệm cao, có những đêm phải thức trắng để hoàn tất bài viết hay hoàn chỉnh phần biên tập.
Qua các số báo, Epsilon đã dần có thêm được nhiều tác giả hơn, nhiều cộng tác viên hơn và nhiều độc giả hơn. Đội ngũ biên tập cũng được bổ sung về số lượng và nâng cao về chất lượng, vừa đảm bảo được công tác biên tập đúng tiến độ, vừa chủ động tạo nguồn bài dồi dào cho các số báo.
Chúng ta đã đi qua được 1 năm đầy khó khăn nhưng cũng thật tự hào. Có năm đầu tiên, có nghĩa là sẽ có năm thứ 2, thứ 3...
Và để Epsilon được tiếp nối, nguồn năng lượng lớn nhất đối với chúng tôi vẫn là sự ủng hộ của các độc giả. Những sự góp ý, bình luận, đặt hàng từ phía các độc giả sẽ là động lực cho Epsilon tiếp tục được ấn hành. Đặc biệt, ban biên tập luôn chờ đón các bài viết từ phía độc giả. Chúng tôi tin rằng những bài viết của các bạn chắc chắn sẽ làm tăng thêm sự phong phú của tạp chí, về nội dung đề tài lẫn phong cách hành văn.
Đi nhiều người ta sẽ đi rất xa.
Tháng 12, 2015,
Ban Biên tập Epsilon.
3
MỤC LỤC
Ban Biên tập Epsilon
Lời ngỏ cho Epsilon số 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Ngô Quang Hưng
Tính duy lý của hàm độc tài . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Lý Ngọc Tuệ
Xấp xỉ Diophantine với độ đo - Định lý Khintchine . . . . . . . . . . . . . . . . . . . . 21
Đàm Thanh Sơn
Hình học rối lượng tử . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I. I. Blekman, A. D. Myshkis, Ya. G. Panovko
Logic của toán học ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Desmond MacHale
Cuộc đời và sự nghiệp của George Boole - Sự khởi đầu cho kỷ nguyên kỹ thuật số . . . . 55
Bình Nguyễn
Nhận dạng chó mèo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Đặng Nguyễn Đức Tiến
Bài toán cân tiền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Nguyễn Tiến Dũng
Xung quanh bài toán hình học trong kỳ thi VMO 2014 . . . . . . . . . . . . . . . . . . 77
Nguyễn Ngọc Giang
Mối liên hệ Euclide, Afin và Xạ ảnh qua một bài toán trong sách "Các phương pháp giải toán quá các kỳ thi Olympic" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Trần Quang Hùng
Về bài hình học thi IMO năm 2009 - Ngày thứ hai . . . . . . . . . . . . . . . . . . . . . 103 4
Tạp chí Epsilon, Số 06, 12/2015
Trần Minh Hiền
Thuật toán tham lam trong xây dựng cấu hình tổ hợp . . . . . . . . . . . . . . . . . . . 109
Lưu Bá Thắng
Định đề Bertrand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Kiều Đình Minh
Chuỗi điều hòa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Yimin Ge
Số dư của A:ax C Bx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Trần Nam Dũng
Bài toán hay lời giải đẹp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
Trần Nam Dũng
Các vấn đề cổ điển và hiện đại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
Ban Biên tập Epsilon
Kỳ thi Toán quốc tế Formula of Unity - The Third Millennium . . . . . . . . . . . . . . 173 5
Tạp chí Epsilon, Số 06, 12/2015
6
TÍNH DUY LÝ CỦA HÀM ĐỘC TÀI
Ngô Quang Hưng
(Đại học Buffalo, Mỹ)
Bài viết này chứng minh một định lý kinh điển của Kinh Tế học, gọi là định lý bất khả thi của Arrow. Định lý có nhiều chứng minh ngắn gọn, chỉ khoảng nửa trang. Nhưng chúng ta sẽ chọn một con đường tương đối dài để đến cùng kết luận. Đích đến, như người ta thường nói, đôi khi không thú vị bằng đường đi.
1. Định lý bất khả thi của Arrow
Marquis de Condorcet là một triết gia, nhà toán học, và nhà khoa học chính trị người Pháp sống ở thế kỷ 18. Năm 1785, ông viết bài “Essay on the Application of Analysis to the Probability of Majority Decisions” có ảnh hưởng sâu rộng đến lý thuyết chọn lựa xã hội, kinh tế học, và đến các thuật toán xếp hạng quảng cáo trên mạng. Condorcet là một trong những người đầu tiên mang (tính chặt chẽ của) Toán học vào nghiên cứu khoa học xã hội. Ông tham gia cách mạng Pháp, viết vài quyển sách bất hủ ủng hộ cho tinh thần Khai Sáng. Ông bị bắt giam gần một năm, và mất trong tù. Nhiều khả năng là do tự uống thuốc độc.
Ông khám phá ra “nghịch lý Condorcet”. Đại để cái nghịch lý này như sau. Giả sử nhà nước cần đầu tư vào ngành giao thông (GT), y tế (YT), hoặc giáo dục (GD). Nhà nước làm trưng cầu dân ý. Mỗi người dân bỏ phiếu xếp hạng của riêng mình về tầm quan trọng của ba ngành này. Ví dụ, anh A bảo tôi nghĩ GD trước, rồi đến GT, rồi đến YT. Anh B chọn YT > GD > GT, vân vân. Thì khả năng sau đây có thể xảy ra: đa số mọi người xếp GD trên YT, đa số xếp YT trên GT, và đa số xếp GT trên GD. Đó là tính phi lý của chọn lựa xã hội. Khi biết cái nghịch lý Condorcet rồi, chúng ta đọc các thống kê xã hội cẩn thận hơn. Obama với McCain cãi nhau, đều lôi thống kê ra. Một ông bảo phải đầu tư cái này do đa số dân chúng ủng hộ cái này hơn cái kia, McCain bảo cái kia hơn cái nọ. Chúng ta nên nghĩ ngay đến khả năng vô lý của chọn lựa xã hội. Có khả năng cả Obama lẫn McCain đều đúng, nhưng đều ... vô lý.
Đến năm 1950, Kenneth Arrow (giải Nobel kinh tế 1972) viết một bài báo rất nổi tiếng về các luật bầu cử [1], trong đó ông chứng minh một định lý nay ta gọi là định lý bất khả thi Arrow1. Định lý Arrow nói rằng “hàm độc tài” là luật bầu cử duy nhất có tính “duy lý” tuyệt đối. Để phát biểu định lý này, ta định nghĩa thế nào là “độc tài”, và thế nào là “duy lý”.
Để đơn giản (nhưng không mất tính tổng quát) ta giả sử xã hội có 3 chọn lựa A-B-C cần xếp hạng bằng bầu cử (GD-YT-GT, hoặc anh Ba-anh Tư-anh Sáu, hoặc bánh mì-sữa-bia). Mỗi phiếu bầu gồm ba đề mục. Đề mục thứ nhất xếp hạng A hơn B hoặc B hơn A. Đề mục thứ hai xếp hạng cặp B, C; và đề mục thứ ba xếp hạng cặp A và C. Nếu anh nào xếp hạng vòng tròn (A hơn B, B hơn C, và C hơn A) thì anh ấy bị chập cheng, không cho bầu. Nói cách khác, ta giả sử tất cả các phiếu bầu đều hợp lệ, nghĩa là không phiếu nào xếp hạng vòng tròn.
1Arrow’s impossibility theorem
7
Tạp chí Epsilon, Số 06, 12/2015
Sau khi có tất cả các phiếu bầu thì xã hội sẽ dựa trên một luật bầu cử để có xếp hạng toàn xã hội của bộ ba A, B, và C, nghĩa là quyết định xem xã hội thích chọn lựa nào hơn giữa A và B, giữa B và C, và giữa C và A. Luật bầu cử sẽ phải thỏa mãn một số tiên đề nhất định:
1. Tính độc lập của các chọn lựa không liên quan2(IIA): việc xã hội xếp hạng A hơn B hay B hơn A thì độc lập với việc mọi người xếp C cao thấp thế nào.
2. Tính nhất trí (còn gọi là hiệu suất Pareto): nếu mọi người đều thích A hơn B thì xã hội cũng phải chọn A hơn B.
3. Tính duy lý: xã hội không thể xếp hạng quẩn quanh theo vòng tròn (A hơn B, B hơn C, và C hơn A).
4. Không độc tài: xếp hạng của xã hội không thể luôn giống hệt như xếp hạng của một anh Tám Tàng nào đó mà không đếm xỉa gì đến phần còn lại của xã hội.
Arrow chứng minh rằng không có luật bầu cử nào thỏa cả bốn điều kiện trên, nếu như tất cả các phiếu cá nhân đều hợp lệ. (Bài báo của Arrow khá là dài dòng văn tự. Với mỗi giả thuyết, tiên đề, ông lại đá sang triết lý và vài kết quả trước đó.) Định lý của Arrow thật sự là một định lý mang tính tổ hợp, và có các chứng minh tổ hợp ngắn gọn.
Phần mô tả ở trên không đủ cụ thể về mặt Toán học để ta chứng minh. Một kỹ năng quan trọng mà người làm Toán ứng dụng cần có là khả năng “Toán học hoá” đối tượng được nghiên cứu trong ngành ứng dụng. Bước “Toán học hoá” vấn đề này đôi khi quan trọng không kém bước giải quyết vấn đề.
Một mô hình Toán học của vấn đề chọn lựa xã hội này như sau. Giả sử có n phiếu bầu. Phiếu bầu thứ i được đại diện bằng một bộ ba .xi; yi; zi/ 2 f1; 1g3; trong đó
(
xi D yi D zi D
1 nếu phiếu i chọn A > B 1 nếu phiếu i chọn B > A (
1 nếu phiếu i chọn B > C 1 nếu phiếu i chọn C > B (
1 nếu phiếu i chọn C > A 1 nếu phiếu i chọn A > C
(Lý do ta chọn f1; 1g thay vì f0; 1g, ftrue; falseg sẽ trở nên rõ ràng hơn dưới đây.) Định nghĩa hàm NAE W f1; 1g3 ! f0; 1g như sau3: NAE.a; b; c/ D 0 nếu và chỉ nếu a D b D c. Khi đó, phiếu .xi; yi; zi/ là phiếu hợp lệ nếu NAE.xi; yi; zi/ D 1. Với n phiếu bầu thì ta có ba vectors x D .xi/niD1, y D .yi/niD1, z D .zi/niD1 2 f1; 1gn. Bây giờ ta mô hình xem bốn tính chất trên phát biểu về mặt toán học như thế nào:
2Independence of irrelevant alternatives
3NAE là viết tắt của “not all equal”.
8
Tạp chí Epsilon, Số 06, 12/2015
1. Tính chất IIA nói rằng chọn lựa của xã hội có thể đúc kết bằng ba hàm số f; g; h W f1; 1gn ! f1; 1g, trong đó
(
f .x/ D g.y/ D h.z/ D
1 nếu xã hội chọn A > B 1 nếu xã hội chọn B > A (
1 nếu xã hội chọn B > C 1 nếu xã hội chọn C > B (
1 nếu xã hội chọn C > A 1 nếu xã hội chọn A > C
2. Tính nhất trí nói là với mọi x 2 f1; 1g, thì f .x; : : : ; x/ D x, g.x; : : : ; x/ D x và h.x; : : : ; x/ D x.
3. Tính duy lý nói là không tồn tại bộ phiếu hợp lệ .x; y; z/ mà lại cho ra chọn lựa xã hội không hợp lệ f .x/ D g.y/ D h.z/.
4. Tính không độc tài mô hình hoá như sau. Với i 2 Œn, gọi Dictilà hàm độc tài4thứ i, trả về phiếu bầu của xi, nghĩa là Dicti.x/ D xi. Tính không độc tài nói rằng f; g; h ¤ Dicti, với mọi i 2 Œn.
Từ tính nhất trí và tính duy lý có thể suy ra rằng f g h. Ta lập luận như sau. Xét bộ ba x, y D x, và z D .f .x/; ; f .x//. Do tính nhất trí ta có h.z/ D f .x/. Như vậy để cho chọn lựa xã hội có tính duy lý thì g.y/ ¤ f .x/; nghĩa là g.x/ D f .x/ với mọi x. Tương tự ta có g.x/ D h.x/ với mọi x. Do đó f h. Lập luận đối xứng dẫn đến f g h.
Tóm lại, chọn lựa của toàn xã hội có thể được mô tả bằng một hàm số f W f1; 1gn ! f1; 1g. Và ta cần tìm một hàm f sao cho
Nếu .x; y; z/ là bộ phiếu hợp lệ thì NAE.f .x/; f .y/; f .z// D 1. (Đây là tính duy lý chủa chọn lựa xã hội.)
f ¤ Dicti với mọi i 2 Œn. (Hàm chọn lựa xã hội không nên là hàm độc tài.)
Định lý Arrow nói rằng không có hàm f nào thoả hai tính chất trên cùng một lúc. (Lưu ý rằng tất cả các hàm độc tài đều là các hàm duy lý!) Chúng ta sẽ chứng minh định lý Arrow bằng phân tích Fourier của các hàm nhị phân. Chứng minh này là phát kiến tuyệt vời của Gil Kalai [2]. Việc nghiên cứu các hàm nhị phân (còn gọi là hàm Bool5) là một đề tài quan trọng trong lý thuyết máy tính. Nó quan trọng một cách hiển nhiên vì máy tính xử lý các bít nhị phân f0; 1g. Nhưng cụ thể hơn, môn giải tích các hàm nhị phân có ứng dụng rất cụ thể trong lý tuyết tính toán hiện đại. Phương pháp giải tích để nghiên cứu các hàm nhị phân là ta tìm cách viết chúng thành tổ hợp tuyến tính của các hàm đơn giản hơn. Để làm được điều này ta cần biến đổi Fourier rời rạc (DFT). Để mô tả DFT một cách tổng quát ta cần lý thuyết biểu diễn nhóm. Do đó ta bắt đầu với lý thuyết biểu diễn.
4Dictator
5Boolean functions
9
Tạp chí Epsilon, Số 06, 12/2015
2. Sơ lược lý tuyết biểu diễn nhóm
Lý thuyết biểu diễn nhóm cho phép ta nghiên cứu các nhóm (trong đại số trừu tượng) dùng đại số tuyến tính. (Đại số tuyến tính vạn tuế!) Bằng cách này, một số vấn đề, đặc tính của các nhóm trừu tượng có thể được giải quyết và tìm hiểu dùng các công cụ của đại số tuyến tính. Từ góc nhìn tổ hợp, quyển “Nhóm đối xứng” của Bruce Sagan rất thú vị [3].
Trước hết ta định nghĩa biểu diễn ma trận6của một nhóm. Một biểu diễn ma trận n chiều của một nhóm G là một phép đồng cấu7 W G ! GLn.F/ trong đó F là một trường đại số, ví dụ như trường số phức, còn GLn.F/ là nhóm tuyến tính tổng quát8 bậc n trên trường F. Tổng quát hơn, ta không nhất thiết phải biểu diễn nhóm bằng các ma trận. Gọi V là một không gian vector có số chiều hữu hạn. Gọi GL.V / là nhóm các biến đổi tuyến tính trên V (nghĩa là GL.V / là tập hợp các ánh xạ tuyến tính khả nghịch). Một phép biểu diễn của nhóm G trên không gian V là phép đồng cấu
W G ! GL.V /:
Nói cách khác, một biểu diễn là một luật gán: ta gán cho mỗi phần tử g của nhóm G một ánh xạ .g/ 2 GL.V / sao cho phép gán này tương thích với các hoạt động của nhóm G. Nếu có một bộ vector cơ sở của V thì ta có thể dễ dàng chuyển thành một phép biểu diễn ma trận. (Trong trường hợp đó, mỗi phần tử g 2 G sẽ có tương ứng một ma trận khả nghịch .g/.)
Ví dụ 1. Xét nhóm G D Zn. Ánh xạ W G ! GLm.R/ gán mỗi phần tử k 2 f0; : : : ; n 1g một ma trận .k/ khả nghịch m m, sao cho, với mọi j; k 2 Zn, ta có
.j C k/ D .j / .k/:
(Đây là định nghĩa của phép đồng cấu.) Do đó, .0/ phải là ma trận đơn vị. Và, với mọi k ta có .k/ D .1/k. Nghĩa là, sau khi đã chọn ma trận khả nghịch .1/ sao cho .1/n D .0/ D Im (nếu được) thì phần còn lại của là hoàn toàn xác định.
Trong phần còn lại của bài này, để đơn giản vấn đề ta chỉ xét V là một không gian tuyến tính m chiều trên trường số phức (hiểu là V D Cm). Như hầu hết các đối tượng trừu tượng khác trong toán học, ta tìm cách chia một phép biểu diễn nhóm thành các thành phần nhỏ hơn, cho đến khi “tối giản”. Từ đó, ta có thể nghiên cứu một cấu trúc lớn bằng các cấu trúc tối giản, với hy vọng là nhiều câu hỏi dễ trả lời hơn.
Một không gian con W của V được gọi là G-bất biến nếu các phần tử gủa G tương ứng với các ánh xạ từ W vào W . Cụ thể hơn, nếu với mọi w 2 W và g 2 G ta có .g/w 2 W thì W được gọi là G-bất biến. Tất nhiên, nếu W là G-bất biến thì ánh xạ thu hẹp của trên W cũng là một biểu diễn của G.
Hai không gian bất biến tầm thường là V và f0Eg. Nếu ngoài hai không gian tầm thường này ra, V không còn không gian con G-bất biến nào khác, thì được gọi là một biểu diễn tối giản của G.
Nếu V là tổng trực tiếp9của hai không gian con G-bất biến W1 và W2, ký hiệu là V D W1 ˚ W2, thì phép biểu diễn trên V là tổng trực tiếp của 1 và 2, viết là D 1 ˚ 2, trong đó 1 và 2
6Matrix representation
7Homomorphism
8General linear group
9Direct sum
10
Tạp chí Epsilon, Số 06, 12/2015
là các thu hẹp của trên W1 và W2, theo thứ tự. Nếu là phép biểu diễn tối giản không phải là tổng trực tiếp của các phép biểu diễn khác, ngoại trừ cái tổng tầm thường V ˚ fOEg.
Ví dụ 2. Xét nhóm G D Z2n, và ánh xạ W G ! GL2.C/ định nghĩa như sau:
.0/ D
1 0 0 1
D I2
.1/ D
e i=n 0 0 e i=n
.k/ D .1/k; k 2 Z2n:
(Lưu ý rằng i là số phức và .1/2n D .0/ như ý.) Trong ví dụ này thì V D C2. Xét
W1 D
a 0
W a 2 C
W2 D
0 b
W b 2 C
:
a
Dễ thấy W1 là một không gian G-bất biến, tại vì với mọi k 2 Z2n và mọi w D 0
2 W1, ta có
.k/w D
ek i=n 0 0 ek i=n
a 0
D
aek i=n 0
2 W1:
Tương tự, W2 cũng bất biến. Ngoài ra C2 D W1 ˚ W2 vì
a
a b
D
a 0
C
0 b
với mọi vector
2 C2. Vì thế, không phải là biểu diễn tối giản. Hai thu hẹp 1 và 2 của b
định nghĩa như sau: 1.0/ D
1 0 0 0
2.0/ D
0 0 0 1
1.k/ D
e ik=n 0 0 0
2.k/ D
0 0
0 e ik=n
là các biểu biễn tối giản có số chiều bằng 1.
Đến đây ta có đủ kiến thức để phát biểu một định lý cực kỳ đơn giản và quan trọng của lý thuyết biểu diễn: định lý Maschke. Định lý này tương tự như định lý “phân tích ra thừa số nguyên tố”, hoặc định lý cơ bản của đại số rằng các đa thức đều là tích của đơn thức tuyến tính. Heinrich Maschke (1853–1908) là một nhà Toán học người Đức. Ông từng theo học các người khổng lồ Weierstrass, Kummer và Kronecker. Tốt nghiệp năm 1880, không tìm được vị trí ở Đức, ông di cư sang Mỹ, nhận được một vị trí trong khoa Toán mới mở của Đại Học Chicago, nơi một nhà Toán học lừng danh của Việt Nam hiện nay đang làm việc; anh cũng là một chuyên gia về lý thuyết biểu diễn.
Định lý 2.1 (Định lý Maschke). Bất kỳ phép biểu diễn (phức) nào trên một nhóm hữu hạn G đều là tổng của các phép biểu diễn tối giản.
11
Tạp chí Epsilon, Số 06, 12/2015
Chứng minh. Ta chỉ cần chứng minh rằng, nếu chưa tối giản thì D 1 ˚ 2 và 1; 2 có số chiều nhỏ hơn. Giả sử W V là một không gian con G-bất biến không tầm thường. Ta chứng minh rằng tồn tại W ? sao cho W ˚ W ? D V và W ? cũng G-bất biến. Gọi f ; g là một dạng Hermit10 tuỳ ý trên không gian V , dễ chứng minh rằng dạng song tuyến sau đây sau đây
hv; wi D 1jGjX g2G
f .g/v; .g/wg
là G-bất biến: hv; wi D h .g/v; .g/wi, 8g 2 G; v; w 2 V . Từ đó, không gian trực giao W ?
của W định nghĩa theo dạng song tuyến này11 cũng là G-bất biến.
Như vậy, ta có thể nghiên cứu các phép biểu diễn dùng các phép biểu diễn “đơn giản hơn” một chút. Tuy nhiên, một phép biểu diễn vẫn là một đối tượng rất phức tạp để mô tả (nó là một phép đồng cấu thỏa mãn một số tính chất đại số, hoặc cũng có thể xem nó là một ma trận nếu ta chọn trước một hệ cơ sở trên không gian V ). Thậm chí, có bao nhiêu phép biểu diễn (không đẳng cấu12 với nhau) ta cũng không biết. Có thể có vô hạn các phép biểu diễn không? Làm thế nào để phân loại chúng?
Để phân loại các phép biểu diễn, có một cách để loại bỏ đa số thông tin về phép biểu diễn, chỉ giữ lại một vài con số! Các con số này chứa rất nhiều thông tin về phép biểu diễn, và ta có thể dùng chúng để phân loại các phép biểu diễn. Kết quả này là một trong những định lý đẹp nhất trong đại số.
Các con số “kỳ diệu” này được chứa trong một hàm gọi là hàm đặc trưng13 của phép biểu diễn. Hàm đặc trưng của phép biểu diễn trên nhóm G là một hàm W G ! C định nghĩa như sau
.g/ D trace. .g//:
(Nhớ rằng .g/ là một toán tử tuyến tính khả nghịch trên không gian phức V , cái vết14 trace. .g// của .g/ là tổng các trị đặc trưng của nó. Hàm đặc trưng cũng là một vector mà các tọa độ được đánh chỉ sổ bởi các thành viên của nhóm G.
Ví dụ 3. Lại xét nhóm G D Zn và một biểu diễn W G ! GLm.C/. Gọi là hàm đặc trưng của biểu diễn này, thì
.0/ D trace. .0// D trace.Im/ D m:
Và với mọi k 2 Zn ta có
.k/ D trace. .k// D trace. .1/k/ DXm iD1
ki
trong đó ilà các trị đặc trưng của .1/. Xét vector đặc trưng v 2 Cm tương ứng với i, thì .1/v D iv. Do đó, .1/nv D niv. Mà .1/n D Im. Do đó, ilà một trong các căn bậc n của 1.
10Hermitian form
11W ? WD fv j hv; wi D 0;8w 2 W g
12Isomorphic
13Character
14Trace
12
Tạp chí Epsilon, Số 06, 12/2015
Tổng quát hơn, định nghĩa số chiều của một hàm đặc trưng là số chiều của không gian V của phép biểu diễn. Định nghĩa một tích vô hướng Hermit giữa các hàm đặc trưng như sau:
h ; 0i D 1jGjX g2G
.g/ 0.g/: (2.1)
(a là liên hợp phức của a.) Hàm đặc trưng của phép biểu diễn chứa cực kỳ nhiều thông tin về phép biểu diễn. Sau đây là vài kết luận quan trọng:
.1/ chính là số chiều của phép biểu diễn. (Lưu ý rằng 1 là phần tử đơn vị của nhóm G. Nếu G D Zn thì 1 là số nguyên 0.)
.g/ D .hgh1/, với mọi phần tử g; h 2 G, nghĩa là hàm đặc trưng có giá trị như nhau trên mỗi lớp liên hợp15 của nhóm.
.g1/ D .g/
Hàm đặc trưng của ˚ 0là tổng C 0của các hàm đặc trưng thành phần ; 0.
Gọi N D jGj, và 1; 2; : : : là các đại diện của các lớp đẳng cấu của các phép biểu diễn tối giản trên G, và gọi ilà hàm đặc trưng của i. Ta có:
– Các vectors i vuông góc với nhau và có chiều dài đơn vị. Gọi c là tổng số các lớp liên hợp của nhóm. Gọi C là không gian vector của các hàm f W G ! C sao cho f có giá trị như nhau trên mỗi lớp liên hợp của G. Ta có, các hàm đặc trưng itạo thành một hệ cơ sở trực chuẩn của C. (Ta sẽ dùng tính chất này để nói thêm về biến đổi Fourier rời rạc trên các nhóm Abel trong đề mục tới.)
– Tổng số các lớp đẳng cấu của các phép biểu diễn tối giản bằng với tổng số các lớp liên hợp của nhóm G. Gọi r là tổng số này.
– Gọi dilà số chiều của i, ta có di chia hết cho N, và
N D d21 C C d2r:
Một hàm đặc trưng bất kỳ của nhóm đều có thể biểu diễn (theo một cách duy nhất) thành tổ hợp tuyến tính của các hàm đặc trưng tối giản.
Hai phép biểu diễn có hàm đặc trưng giống nhau thì đẳng cấu với nhau Một hàm đặc trưng là tối giản nếu và chỉ nếu nó có chiều dài đơn vị (nghĩa là h ; i D 1) Nếu G là một nhóm Abel thì các biểu diễn tối giản của nó đều có số chiều bằng 1.
Có một hệ quả tuyệt đẹp của lý thuyết biểu diễn nhóm khi G là nhóm các hoán vị của n phần tử. Gọi f là số các standard Young tableaux dạng . Ta có:
X `n
.f /2 D nŠ
Định lý này cũng có thể chứng minh bằng giải thuật Robinson-Schensted. 15Conjugacy class
13
Tạp chí Epsilon, Số 06, 12/2015
3. Biến đổi Fourier rời rạc
Tôi học về biến đổi Fourier rời rạc (DFT) lần đầu tiên vào khoảng năm 1993. Học xong thấy rất hoang mang, theo kiểu: nếu lấy vector này, tính toán thế này, thì ra các hệ số thế kia, nhưng không hiểu ý tưởng nằm sau các công thức đó. Sau khám phá ra là DFT chẳng qua là một phép thay đổi cơ sở trong không gian tuyến tính. Từ đó thấy mọi thứ rõ ràng, dễ hiểu hẳn ra.
3.1. Biểu diễn nhóm Abel hữu hạn
Các biểu diễn tối giản của một nhóm Abel bất kỳ đều là các biểu diễn với số chiều bằng một. Nếu nhóm có n phần tử thì có n hàm đặc trưng trực giao. Nhóm tuần toàn là một nhóm Abel. Nhóm tuần hoàn Zn có đúng n hàm đặc trưng tối giản a; a 2 Zn. Mỗi hàm đặc trưng a là một vector trong trường vector phức Cn, định nghĩa là a.b/ D !ab
n, trong đó !n D e2 i=n là căn
nguyên thuỷ. Các hàm đặc trưng này là một hệ trực chuẩn theo tích Hermit (2.1):
h a; bi D 1nX
c2Zn
(ıab D 1 nếu a D b và 0 nếu a ¤ b.)
a.c/ b.c/ D ıab:
Định lý cơ bản của các nhóm Abel hữu hạn nói rằng các nhóm Abel hữu hạn G đều có thể viết dưới dạng tổng trực tiếp của các nhóm tuần hoàn: G Š Zm1 ˚ ˚ Zmk. Các biểu diễn tối giản của nhóm G là tăng sờ của các biểu diễn tối giản của các nhóm tuần hoàn Zmi. Các hàm đặc trưng tối giản của nhóm G là tích tăng sờ của các hàm đặc trưng tối giản của các nhóm tuần hoàn Zmi. Với mỗi phần tử a D .a1; ; ak/ 2 Zm1 ˚ ˚ Zmk, ta có một hàm đặc trưng tối giản a của nhóm G định nghĩa như sau: với một “tọa độ" b D .b1; ; bk/ 2 Zm1 ˚ ˚ Zmkthì
a.b/ DYk iD1
!aibi
mi D !a1b1
m1 !akbk
mk:
Một trường hợp đặc biệt của nhóm Abel hữu hạn rất quan trọng trong bài này và trong khoa học Máy Tính nói chung là là G D Zn2 D f0; 1gn. Mỗi phần tử của G là một đỉnh của khối lập phương n-chiều, là một phép gán sự thật16 vào n biến nhị phân, hoặc là một tập con S Œn trong đó S là tập các tọa độ bằng 1 của phần tử. Ở đây, nhóm G có N D 2n phần tử, và vì thế N hàm đặc trưng. Do !2 D 1, với mỗi cặp a; b 2 Zn2ta có a.b/ D .1/a b.
Thay vì dùng a; b để đánh số các hàm đặc trưng và các tọa độ của chúng, ta có thể dùng các tập con A; B của Œn để đánh chỉ số, trong đó A D fi j ai D 1g, và B D fi j bi D 1g. Theo cách này, bộ các hàm đặc trưng có thể định nghĩa bằng A.B/ D .1/jA\Bj. Còn nếu chúng ta dùng
b 2 Zn2làm tham số thì A.b/ D .1/Pi2A bi. Bạn nên làm quen với việc chuyển qua lại giữa các tập con và các vectors của Zn2.
Lý do chính chúng ta quan tâm đến các hàm đặc trưng tối giản của nhóm Zn2là như sau. Ta cần nghiên cứu các hàm nhị phân gồm n biến nhị phân kiểu như f W f0; 1gn ! f0; 1g. Mỗi hàm loại này có thể xem là một vector trong không gian f0; 1gN . Dĩ nhiên, chúng cũng là các vectors trong không gian RN và CN . Như đã phân tích ở trên, các hàm đặc trưng tối giản là một cơ sở trực
16Truth assignment
14
Tạp chí Epsilon, Số 06, 12/2015
chuẩn của không gian CN . Vì thế, một hàm nhị phân n biến bất kỳ, nếu viết thành một vector trong không gian CN , đều là tổ hợp tuyến tính của các hàm đặc trưng tối giản.
Thay vì làm việc trên không gian vector CN , một cách tương đương chúng ta cũng có thể làm việc trên không gian (tuyến tính) của hàm số f W f0; 1gn ! C. Hàm f W f0; 1gn ! C bất kỳ đều có thể biểu diễn dưới dạng
f .y/ DX S Œn
fOS S.y/ DX S Œn
fOS.1/Pi2S yi:
Để cái đám yitrên số mũ thì hơi khó chịu. Chúng ta đổi biến. Đặt xi D .1/yi. Nghĩa là nếu yi D 0 (FALSE) thì xi D 1, còn yi D 1 (TRUE) thì xi D 1. Thì ta có phát biểu sau đây: Bổ đề 1. Mọi hàm f W f1; 1gn ! C đều có thể viết dưới dạng
f .x/ DX S Œn
fOS S.x/;
trong đó (lạm dụng ký hiệu một chút) S W f1; 1gn ! f1; 1g là một hàm đơn thức17
S.x/ D S.x1; ; xn/ DY i2S
xi:
Đám hàm S bây giờ gọi là hệ cơ sở đơn thức của các hàm f W f1; 1gn ! C. Nhớ rằng cái hệ cơ sở đơn thức này là một hệ cơ sở trực chuẩn của không gian các hàm f W f1; 1gn ! C. Trong đó, “tích vô hướng" của hai hàm f; g bất kỳ được định nghĩa là
hf; gi D 12nX x2f1;1gn
f .x/g.x/ D Ex
h
f .x/g.x/
i
;
trong đó trị kỳ vọng ở vế phải tính trên phân bố đều của các vectors x 2 f1; 1gn. Chúng ta sẽ thấy rằng hiểu tích vô hướng của hai hàm là trị kỳ vọng của tích như trên rất hữu dụng về sau.
3.2. Biến đổi Fourier rời rạc
Ý tưởng chính của biến đổi Fourier rời rạc chỉ là một phát biểu cơ bản của đại số tuyến tính: các vector trong một không gian vector đều là tổ hợp tuyến tính của một hệ cơ sở bất kỳ của không gian đó. (Xem thêm bài của Terry Tao giới thiệu về biến đổi Fourier nói chung, và quyển sách tuyệt vời của anh Vũ Hà Văn và Terry Tao có các ứng dụng của giải tích đồng điều trong toán tổ hợp [4]).
Trong ngữ cảnh của chúng ta, mỗi hàm f W f1; 1gn ! R đều là tổ hợp tuyến tính của các hàm
đơn thức:
f .x/ DX S Œn
fOS S.x/;
Tổ hợp này là duy nhất. Các hệ số fOS D hf; Si gọi là các hệ số Fourier của f . Chúng là các số thực vì f và S là các vectors thực. Từ giờ trở đi chúng ta có thểm làm việc luôn trên không gian RN thay vì CN và không cần cái liên hợp khi tính tích vô hướng của hai vectors nữa. Hệ cơ sở đơn thức S cũng được gọi là hệ cơ sở Fourier.
Hai đẳng thức cơ bản nhất của biến đổi Fourier là
17Monomial
15
Tạp chí Epsilon, Số 06, 12/2015
đẳng thức Plancherel
ExŒf .x/g.x/ D hf; gi D X
S Œn
và trường hợp đặc biệt là đẳng thức Paserval
fOSgOS D Nhf ;O gOi
Ex f2.x/ D hf; f i D X S Œn
fO2S:
Dễ chứng minh hai đẳng thức trên từ định nghĩa và tính trực chuẩn của các S. (Đôi khi, để đảm bảo tính đối xứng người ta định nghĩa tích vô hướng như trên nhưng chia cho căn bậc hai của N.)
4. Luật bầu cử và biến đổi Fourier cho các hàm nhị phân
4.1. Luật bầu cử nói chung
Trong trường hợp hàm nhị phân f W f1; 1gn ! f1; 1g thì f2.x/ D 1 với mọi x, vì thế đẳng
thức Parseval nói rằngX S Œn
fO2S D 1:
Một hàm nhị phân như một “luật” bầu cử. Có n phiếu bầu xi cho hai ứng cử viên 1 và 1. Hàm f trả về người thắng cử. Sau đây là một số hàm (luật) bầu cử hay thấy trên thực tế:
Majnlà hàm bầu đa số, chỉ định nghĩa với n lẻ, trả về 1 nếu đa số các “phiếu” là 1, và trả về 1 nếu đa số các phiếu là 1.
Dictilà hàm độc tài (đã định nghĩa), trả về phiếu bầu của xi, nghĩa là Dicti.x/ D xi.
Const1 và Const1 là các hàm hằng số (hay hàm “đảng cử, dân bầu"), luôn trả về giá trị đảng cử 1 hoặc 1.
Ta cũng có thể định nghĩa một số hàm khác như hàm chẵn lẻ, hàm “electoral college” (như trong luật bầu cử của Mỹ), vân vân. Xem bài này của Ryan O’Donnell để thêm một số ví dụ.
Với một luật bầu cử nhất định, chúng ta muốn biết nhiều thuộc tính của nó.
Nó có thiên vị không? Thiên vị ở đây được hiểu như sau, nếu ta lấy một bộ n phiếu bầu ngẫu nhiên thì xác suất mà kết quả là 1 hoặc 1 khác nhau cỡ nào. Một luật bầu là “công bằng” nếu hai xác suất này bằng nhau. Do đó, ta định nghĩa sự thiên vị của hàm f bằng
PxŒf .x/ D 1 PxŒf .x/ D 1 D ExŒf .x/ :
Đến đây thì ta thấy phân tích Fourier có lợi thế nào. Do hàm ; D 1, độ thiên vị của f là ExŒf .x/ D ExŒf .x/ ;.x/ D fO;:
Độ thiên vị của f chính bằng với hệ số Fourier thứ nhất! Dễ thấy rằng các hàm đảng cử/dân bầu có thiên vị là ˙1. Các hàm độc tài và hàm đa số có độ thiên vị bằng 0.
16
Tạp chí Epsilon, Số 06, 12/2015
Ảnh hưởng của một phiếu nào đó ra sao? Nếu Tám Tàng đổi phiếu từ 1 sang 1 thì kết quả bị đổi thế nào? Với bộ phiếu x, gọi x˚ilà bộ phiếu mà ta đổi phiếu xilại. Thì tầm ảnh hưởng (Influence) của phiếu thứ i trên kết quả được định nghĩa là
Infi.f / WD PxŒf .x/ ¤ f .x˚i/:
Trong lý thuyết chọn lựa xã hội thì tầm ảnh hưởng này còn được gọi là chỉ số sức mạnh Banzhaf hoặc chỉ số Banzhaf-Penrose index. Chỉ số này đã có một ít ảnh hưởng trong một vài phiên tòa về bầu cử.
Bài tập 1. Chứng minh rằng Infi.f / DPi2SfO2S:
Dễ thấy rằng tầm ảnh hưởng của các hàm đảng cử là 0, tầm ảnh hưởng của hàm độc tài là 0 cho tất cả trừ anh độc tài có ảnh hưởng bằng 1. Tầm ảnh hưởng của hàm đa số thì mất
q
2
công hơn một chút. Dùng xấp xỉ Stirling ta cũng tính được nó bằng khoảng n.
Ảnh hưởng của nhiễu ra sao? Khi ghi lại cả triệu phiếu bầu thì xác suất mà một phiếu bị ghi sai không bỏ qua được. Gọi xác suất này là chẳng hạn. Giả sử ta lấy một bộ phiếu bầu x hoàn toàn ngẫu nhiên. Gọi y là bộ phiếu đạt được bằng cách lật mỗi phiếu xi với xác suất . Dễ thấy, với mọi i,
ExŒxiyi D 1 2 :
Do đó cặp .x; y/ được gọi là .1 2 /-correlated. Độ ổn định nhiễu của f tại .1 2 / được định nghĩa là
Stab12 .f / D Ex;y
.12 /cor
Ngược lại:
Œf .x/f .y/ D ExŒf .x/ D f .y/ ExŒf .x/ ¤ f .y/:
ExŒf .x/ D f .y/ D12C12Stab12 .f /:
Bài tập 2. Chứng minh rằng:
Stab12 .f / DX S Œn
.1 2 /jSjfO2S:
Độ ổn định nhiễu của các hàm đảng cử là 1, của hàm độc tài thứ i là 1 2 . Độ ổn định nhiễu của hàm đa số là thú vị nhất. Có thể chứng minh được điều sau đây:
n!1Stab12 .Majn/ D 1 2 arccos.1 2 /:
lim
Nếu ta dùng xấp xỉ arccos.1 2 / 2p (khá tốt khi nhỏ) thì ta thấy rằng cái nhiễu dẫn đến xác suất khoảng 2 p là kết quả bầu cử bị thay đổi.
17
Tạp chí Epsilon, Số 06, 12/2015
4.2. Chứng minh định lý Arrow
Giả sử tồn tại hàm f sao cho, với bất kỳ bộ phiếu hợp lệ nào .x; y; z/ nào, cái chọn lựa xã hội .f .x/; f .y/; f .z// cũng duy lý. Ta sẽ chứng minh rằng f phải là hàm độc tài. Với mỗi cá nhân i, chọn bộ ba .xi; yi; zi/ ngẫu nhiên từ một trong 6 bộ ba hợp lệ .1; 1; 1/, .1; 1; 1/, .1; 1; 1/, .1; 1; 1/, .1; 1; 1/, và .1; 1; 1/. Ta sẽ có một bộ ba vectors .x; y; z/ hợp lệ. Xác suất mà .f .x/; f .y/; f .z// là duy lý phải bằng 1.
Khai triển Fourier của hàm NAE là
NAE.a; b; c/ D3414ab 14bc 14ca:
Như vậy, xác suất mà .f .x/; f .y/; f .z// là duy lý sẽ bằng
Ex;y;zŒNAE.f .x/; f .y/; f .z/ D3414E Œf .x/f .y/ 14E Œf .y/f .z/ 14E Œf .z/f .x/ : Do x; y; z có vai trò như nhau, ta kết luận
Ex;y;zŒNAE.f .x/; f .y/; f .z/ D3434E Œf .x/f .y/ :
Nhớ rằng trị kỳ vọng được tính từ cách lấy các bộ ba duy lý x; y; z như mô tả ở trên. Từ đó dễ thấy rằng x; y là một cặp .1=3/-correlated. Do đó
E Œf .x/f .y/ D Stab1=3.f / DX S Œn
.1=3/jSjfO2S:
Để cho gọn, ta định nghĩa Wk.f / DPjSjDkjfO2S. Nhớ rằng PSfO2S D 1, do đó Pk Wk.f / D 1. Do đó, xác suất mà .f .x/; f .y/; f .z// là duy lý bằng
3
4
3 4
Xn kD0
.1=3/kWk.f / D3434W0.f / C14W1.f / 136W2.f / C
Xác suất này chỉ có thể bằng 1 nếu W1.f / D 1 và Wk.f / D 0 với mọi k ¤ 1. Nhưng W1.f / D 1 nếu và chỉ nếu f D Dicti hoặc f D Dicti với i nào đó. Nhưng f phải thỏa tính nhất trí, do đó f D Dicti. Và đó là tính duy lý của sự độc tài.
Chứng minh định lý Arrow bằng phương pháp này không chỉ để cho vui. Chứng minh cũ của Arrow không cho chúng ta biết xác suất sự phí lý của chọn lựa xã hội là bao nhiêu. Phân tích Fourier cho chúng ta biết, nếu ta dùng hàm đa số, khi n tiến đến vô cùng thì xác suất có chọn lựa
xã hội duy lý là
3
3
4
4
1 2 arccos.1=3/ :912:
Con số này gọi là số Guilbaud. Chúng ta không những biết nghịch lý Condorcet có thể xảy ra mà còn biết cả xác suất của nó (giả sử ai cũng chọn phiếu bầu hợp lệ ngẫu nhiên, không suy nghĩ).
18
Tạp chí Epsilon, Số 06, 12/2015
Tài liệu tham khảo
[1] ARROW, K. J. A Difficulty in the Concept of Social Welfare. Journal of Political Economy 58 (1950), 328.
[2] KALAI, G. A Fourier-theoretic perspective on the Condorcet paradox and Arrow’s theorem. Adv. in Appl. Math. 29, 3 (2002), 412–426.
[3] SAGAN, B. E. The symmetric group, second ed., vol. 203 of Graduate Texts in Mathematics. Springer-Verlag, New York, 2001. Representations, combinatorial algorithms, and symmetric functions.
[4] TAO, T., AND VU, V. H. Additive combinatorics, vol. 105 of Cambridge Studies in Ad vanced Mathematics. Cambridge University Press, Cambridge, 2010. Paperback edition [of MR2289012].
19
Tạp chí Epsilon, Số 06, 12/2015
20
XẤP XỈ DIOPHANTINE VỚI ĐỘ ĐO ĐỊNH LÝ KHINTCHINE
Lý Ngọc Tuệ
(Đại học Brandeis, Massachusetts, Mỹ)
1. Giới thiệu
Trong phần 1 [5], chúng ta đã có được câu trả lời cho câu hỏi về khả năng xấp xỉ số thực bởi số hữu tỉ qua Định lý Dirichlet:
Định lý 1.1 (Dirichlet 1948). Với mọi số vô tỉ x 2 R XQ, tồn tại vô số số hữu tỉ pq2 Q sao cho: ˇˇˇˇx pqˇˇˇˇ<1q2; (1.1)
và mở rộng kết quả này ra không gian véc tơ Rntrong phần 2 [6]. Mặt khác, Định lý Dirichlet được chứng minh là tối ưu qua sự tồn tại của các số/véc tơ xấp xỉ kém. Nói một cách khác, với mọi số vô tỉ x, ta có thể tìm được vô số nghiệm hữu tỉ pqcho bất đẳng thức (1.1). Tuy nhiên, Định lý Dirichlet xét chung tất cả các số vô tỉ, nếu như xét riêng biệt từng số vô tỉ x thì hàm xấp xỉ 1q2có thể không phải là tối ưu. Chẳng hạn như các số Liouville L được định nghĩa như sau: một số vô tỉ x được gọi là một số Liouville x 2 L nếu như với mọi n 1, tồn tại một số hữu tỉ pq2 Q sao cho:ˇˇˇˇx pqˇˇˇˇ<1qn: (1.2)
Vào năm 1844, nhà toán học Joseph Liouville đã chứng minh rằng tập L không rỗng, và là ví dụ đầu tiên về số siêu việt (transcendental numbers). Lưu ý rằng nếu như x 2 L là một số Liouville thì với mọi n 1, bất đẳng thức (1.2) có vô số nghiệm pq2 Q.
Trong phần này, chúng ta sẽ đưa thêm yếu tố độ đo vào vấn đề về khả năng xấp xỉ số thực bởi số hữu tỉ. Nói một cách cụ thể hơn, nếu như ta thay “Với mọi số" trong Định lý Dirichlet bằng “Với hầu hết mọi số (theo độ đo Lebesgue)" thì ta có thể thay hàm số xấp xỉ 1q2bằng hàm số nào?
Câu hỏi này đã được A. Y. Khintchine trả lời hoàn toàn vào năm 1924 [1] và mở rộng ra cho không gian véc tơ Rnvào năm 1926 [2]. Kết quả này sau đấy đã được A. V. Groshev chứng minh cho không gian ma trận Mm;n.R/ vào năm 1938.
Để giới thiệu kết quả của Khintchine, chúng ta cần một số ký hiệu sau: Hàm số được gọi là một hàm xấp xỉ nếu như W Œ1;1/ ! .0;1/ là một hàm không tăng. Ta gọi số thực x 2 R là
21
Tạp chí Epsilon, Số 06, 12/2015
một số -xấp xỉ được ( -approximable) nếu như tồn tại vô số số hữu tỉ pq2 Q với q > 0 sao cho:ˇˇˇˇx pqˇˇˇˇ< .q/
q: (1.3)
Tập các số -xấp xỉ được được ký hiệu là WA. /.
Định lý Dirichlet trên R có thể được viết lại theo ký hiệu mới này như sau: Nếu như .q/ D1qthì WA. / D R:
Định lý Khintchine cho tập số thực R được phát biểu như sau:
Định lý 1.2 (Khintchine 1924). Giả sử như là một hàm xấp xỉ sao cho q .q/ là một hàm không tăng, và ký hiệu .E/ là độ đo Lebesgue của tập E.
(i) Nếu như chuỗi X1 nD1
(ii) Nếu như chuỗi X1 nD1
.n/ hội tụ thì .WA. // D 0. .n/ phân kỳ thì .R X WA. // D 0.
Nói một cách khác, nếu như chuỗiX1 nD1
hội tụ thì với hầu hết tất cả các số thực, bất đẳng thức (1.3)
có vô số nghiệm hữu tỉ; còn nếu như chuỗi này phân kỳ, với hầu hết tất cả các số thực, bất đẳng thức (1.3) chỉ có hữu hạn nghiệm hữu tỉ.
Lưu ý 1.3. Các kết quả dạng như Định lý 1.2 trong lý thuyết xấp xỉ Diophantine thường được gọi là các Định luật 0-1 .
Lưu ý 1.4. Một số hệ quả trực tiếp thú vị của Định lý Khintchine như sau: (i) Tập các số xấp xỉ kém BA có độ đo Lebesgue bằng 0.
(ii) Với hầu hết mọi số thực x, bất phương trình:
ˇˇˇˇx pqˇˇˇˇ<1
q2 log q
có vô số nghiệm hữu tỉ.
(iii) Với > 0 bất kỳ và với hầu hết mọi số thực x, bất phương trình:
ˇˇˇˇx pqˇˇˇˇ<1
q2.log q/1C
chỉ có hữu hạn nghiệm hữu tỉ.
Trong phần còn lại của bài này, chúng ta sẽ giới thiệu tóm tắt về độ đo Lebesgue, và công cụ chính để chứng minh Định lý 1.2: Bổ đề Borel-Cantelli trong lý thuyết xác suất và liên phân số.
22
Tạp chí Epsilon, Số 06, 12/2015
2. Phần hội tụ của Định lý Khintchine
Có rất nhiều tài liệu tham khảo cho phần này. Ở đây chúng tôi chỉ giới thiệu một số định nghĩa và tính chất cơ bản để dẫn đến Bổ đề Borel-Cantelli.
2.1. Độ đo Lebesgue
Độ đo Lebesgue trên không gian Rnlà mở rộng của khái niệm độ dài (n D 1), diện tích (n D 2), và thể tích (n 3). Trên R, các đoạn thẳng .a; b/ là thước đo cơ bản để đo độ dài của một tập hợp, và độ đo đoạn .a; b/ được định nghĩa bởi: ..a; b// WD b a. Độ đo (ngoài) của một tập E R bất kỳ được xây dựng bằng cách sử dụng một số đếm được các đoạn thẳng để phủ lên tập E với tổng độ dài càng nhỏ càng tốt:
.E/ WD inf
(X1 iD1
.Ii/ W E [1 iD1
Ii với Iilà các đoạn thẳng
)
:
Một tập con E R được gọi là một tập đo được nếu như với mọi A R: .A/ D .A \ E/ C .A \ .R X E//:
Tập các tập đo được tạo thành một -đại số thỏa mãn các tính chất sau: ( 1) Tập rỗng ; và R là các tập đo được.
( 2) Nếu như E là một tập đo được thì phần bù R X E cũng là một tập đo được.
( 3) Nếu như A1; A2; ::: là các tập đo được thì [1 iD1
Ai cũng là một tập đo được.
Độ đo Lebesgue trên các tập đo được thỏa mãn các tính chất sau: (M0) .;/ D 0.
(M1) Nếu như A B là 2 tập đo được thì .A/ .B/. (M2) Nếu như A1; A2; ::: là một dãy các tập đo được rời nhau từng cặp thì:
[1 iD1
!
Ai
DX1 iD1
.Ai/:
Lưu ý 2.1. Áp dụng Tiên đề chọn (Axiom of Choice), ta có thể xây dựng được tập con của R không đo được chẳng hạn như tập Vitaly hoặc tập Bernstein. Tập không đo được dẫn đến một số nghịch lý như nghịch lý Banach-Tarski. Mặt khác, nếu như ta bỏ Tiên đề chọn, Solovay [4] chứng minh rằng tồn tại một mô hình của tập số thực mà trong đó, mọi tập con đều là tập đo được.
Lưu ý 2.2. Ta nói một tính chất P thỏa mãn với hầu hết mọi số x, nếu như tập fx 2 R W x không thỏa mãn tính chất Pg có độ đo Lebesgue bằng 0.
Bài tập 2.3. Chứng minh rằng .Œa; b/ D b a.
23
Tạp chí Epsilon, Số 06, 12/2015
Bài tập 2.4. Chứng minh rằng nếu E R là một tập đến được thì .E/ D 0. Bài tập 2.5. Tìm độ đo Lebesgue của tập Cantor:
(
C WD
x 2 Œ0; 1 W x DX1 iD1
ai
3i; ai 2 f0; 2g
)
:
Bài tập 2.6. Tìm độ đo Lebesgue của tập Liouville L.
2.2. Tập limsup và Bổ đề Borel-Cantelli
Gọi X là một không gian bất kỳ. Một họ B các tập con của X thỏa mãn các tính chất tương tự như ( 1)–( 3) được gọi là một -đại số của các tập đo được trên X. Một hàm không âm W B ! R 0 thỏa mãn các tính chất như M(0)–M(2) được gọi là một độ đo trên X. Bộ 3 .X; B; / được gọi là một không gian đo.
Nếu như 0 < .X / < 1, ta có thể thay độ đo bằng độ đo 0.E/ D .E/
.X / để cho 0.X / D 1.
Không gian đo .X; B; / với .X / D 1 được gọi là một không gian xác suất. Trong lý thuyết xác suất, các tập đo được E 2 B tương ứng với các sự kiện, và độ đo .E/ của E tương ứng với xác suất để sự kiện E xảy ra.
Với một dãy các tập con E1; E2; ::: của X, ta định nghĩa tập limsup của dãy này như sau:
lim sup n!1
En WD \1 nD1
[1
kDn
Ek D˚x 2 X W có vô số i’s sao cho x 2 Ei :
Nói cách khác, nếu như E D lim sup n!1
En là sự kiện "có vô số sự kiện En xảy ra". Bổ đề
Borel–Cantelli có thể được phát biểu như sau:
Bổ đề 2.7 (Bổ đề Borel-Cantelli). Cho .X; B; / là một không gian xác suất, và E1; E2; :::; 2 B
là các sự kiện. Nếu như chuỗi X1 nD1
.En/ hội tụ, thì:
D 0:
Bài tập 2.8. Chứng minh Bổ đề 2.7.
lim sup n!1
En
Bài tập 2.9. Tìm phản ví dụ cho mệnh đề đảo của Bổ đề 2.7.
Trở lại với Định lý Khintchine, để áp dụng được Bổ đề Borel-Cantelli, ta cần có một không gian xác suất, và biểu diễn tập có số -xấp xỉ được WA. / dưới dạng một tập limsup.
Bài tập 2.10. Chứng minh rằng x 2 WA. / khi và chỉ khi x C 1 2 WA. /. 24
Tạp chí Epsilon, Số 06, 12/2015
Áp dụng bài tập trên, để chứng minh Định lý Khintchine, ta chỉ cần tập trung vào các số nằm trong đoạn Œ0; 1/. Giới hạn độ đo Lebesgue trên đoạn Œ0; 1/ sẽ cho ta một không gian xác suất.
Đặt
En D
x 2 R W
ˇˇˇx pnˇˇˇ< .n/ n
;
ta có thể biểu diễn tập WA. / dưới dạng một tập limsup như sau:
WA. / D lim sup n!1
En:
Bài tập 2.11. Tìm độ đo Lebesgue của En \Œ0; 1 (tập này chỉ bao gồm hữu hạn các đoạn thẳng).
Bài tập 2.12. Chứng minh rằng nếu như chuỗi X1
.n/ hội tụ thì chuỗi X1
.En \ Œ0; 1// hội
tụ.
nD1
nD1
Áp dụng Bài tập 2.10 và Bổ đề Borel-Cantelli, ta có được phần hội tụ của Định lý Khintchine. 3. Phần phân kỳ của Định lý Khintchine
Để chứng minh phần phân kỳ của Định lý 1.2, chúng ta sẽ sử dụng công cụ tốt nhất cho xấp xỉ mà ta có được trên tập số thực: liên phân số.
3.1. Một số điều cơ bản của Liên phân số
Nhắc lại trong phần 1 [5], chúng ta gọi một liên phân số hữu hạn có độ dài .n C 1/ là một biểu
thức có dạng:
ŒaoI a1; :::; an WD a0 C1 a1 C1
::: C1an
với một dãy số thực hữu hạn a0 2 R; a1; :::; an 2 R X f0g.
Khi a0 2 Z; a1; :::; an 2 N, ta gọi biểu thức trên là một liên phân số đơn hữu hạn. Với mọi dãy a0 2 Z; a1; a2; ::: 2 N, dãy các liên phân số đơn hữu hạn Œa0I a1; :::; an là một dãy hội tụ khi n ! 1, và ta ký hiệu giới hạn này là:
Œa0I a1; ::: WD lim
n!1Œa0I a1; :::; an:
Mỗi số vô tỉ x 2 R X Q có thể được biểu diễn duy nhất dưới dạng một liên phân số đơn vô hạn: x D Œa0I a1; ::::
Với cách biểu diễn như trên, phân số hội tụ thứ n của x là:
qnDpn.x/
pn
qn.x/ D Œa0I a1; :::; an; 25
Tạp chí Epsilon, Số 06, 12/2015
vớipn
qnở dạng tối giản.
Đặt xnC1 D ŒanC1I anC2; :::, chúng ta có được công thức sau:
Bổ đề 3.1. Với mọi n 0:
x DxnC1pn C pn1 xnC1qn C qn1:
Tuy trông có vẻ phức tạp, nhưng biểu diễn số thực bằng liên phân số có tính chất sau giống với biểu diễn các số trong hệ thập phân:
Bổ đề 3.2. Giả sử như x D Œa0I a1; ::: và y D Œb0I b1; :::.
pn
qn< y 13 .J.0; a1; :::; amCn/X k f .mCnC1/
>13 .J.0; a1; :::; amCn/Z 1
1
k2(Bổ đề 3.9) dx
x2
D1
f .mCnC1/C1
Mặt khác,
Từ đó ta suy ra:
3.f .m C n C 1/ C 1/ .J.0; a1; :::; amCn/:
J.0; a1; :::; amCn/ D[1
J.0; a1; :::; amCn; k/:
kD1
0
@[
k 0 sao cho với hầu hết mọi số x D Œa0I a1; :::, tồn tại N > 0 sao cho với mọi n N,
qn < eC n:
Chứng minh. Đặt Vì
En.g/ D[ a1a2:::an g
J.0; a1; :::; an/:
.J.0; a1; :::; an// D
ˇˇˇˇpn
qn
pn C pn1 qn C qn1
ˇˇˇˇ D1
qn.qn C qn1/<1q2n<1 .a1a2:::an/2
ta có được cận trên cho độ đo của En.g/: .En.g// < X
a1a2:::an g
1
.a1a2:::an/2:
Tích ở bên tay phải có thể bị chặn bởi tích phân như sau:
Yn iD1
a2iDYn
1
iD1
1 C1ai 1 ai.ai C 1/
2n Yn iD1
1
ai.ai C 1/
D 2n Yn iD1
Z aiC1 ai
dxi x2i
Z anC1
D 2n
Z a1C1 a1
Z a2C1 a2
: : :
an
dx1dx2 : : : dxn x21x22: : : x2n
Gọi In.g/ là tích phân:Z Z : : :
trên miền:
Zdx1dx2 : : : dxn x21x22: : : x2n
x1; :::; xn 1; và x1x2 : : : xn g;
ta có được:
.En.g// < 2nIn.g/:
Bài tập 3.10. Chứng minh rằng khi g 1, In.g/ D 1. Bài tập 3.11. Chứng minh rằng khi g > 1,
In.g/ D1gXn1 iD0
29
.ln g/i i Š:
Tạp chí Epsilon, Số 06, 12/2015
Đặt g D eAn, với một hằng số A > 1 bất kì, ta có được:
EneAn < en.ln 2A/Xn1 iD0
.An/i i Š
< en.ln 2A/n.An/n
nŠ
< Ben.ln 2A/ n.An/n
nnenpn(công thức Stirling)
< B0pnen.Aln Aln 21/:
Với A đủ lớn,
A ln A ln 2 1 > 0;
và khi đó, chuỗi X1 nD1
EneAn hội tụ. Theo Bổ đề Borel-Cantelli, với hầu hết mọi số x trong
đoạn Œ0; 1/, x chỉ nằm trong hữu hạn các tập EneAn . Hay nói một cách khác, với hầu hết mọi số trong khoảng Œ0; 1/, với mọi n đủ lớn,
a1a2:::an < eAn:
Khi đó,
qn D anqn1 C qn2 < 2anqn1 < ::: < 2nanan1:::a1 < 2neAn D eC n
với C D A C ln 2.
Chứng minh Định lý Khintchine. Giả sử như chuỗi X1 nD1
.n/ phân kỳ, đặt:
f .x/ D eCx eCx ;
với C là hằng số có được từ Bổ đề 3.9. Tích phân:
Z b a
f .x/dx D1CZ Cb Ca
.u/du
với 0 < a < b tiến đến vô cùng khi b ! 1, và vì hàm f .x/ không tăng theo giả thuyết, ta có
được chuỗi X1 nD1
f .n/ phân kỳ.
Áp dụng Định lý 3.5, với hầu hết mọi số x D Œa0I a1; :::, tồn tại vô số chỉ số n sao cho: anC1 1
f .n/:
Từ đó suy ra:ˇˇˇˇx pn
ˇˇˇˇ 1
anC1q2n f .n/
qn
qnqnC1 1 30
q2n
Tạp chí Epsilon, Số 06, 12/2015
Theo Bổ đề 3.9, với hầu hết mọi số x D Œa0I a1; ::: và với mọi n đủ lớn, qn < eC n () n >ln qn
C:
Vì vậy, ta có được, hầu hết mọi x D Œa0I a1; :::, tồn tại vô số chỉ số n sao cho:
ln qn
ˇˇˇˇx pn
ˇˇˇˇ f .n/
f
q2nD .qn/
qn;
qn
tức là x 2 WA. /.
Tài liệu tham khảo
q2n
C
[1] A. Y. Khintchine, Einige Satze ¨ uber Kettenbr ¨ uche, mit Anwendungen auf die Theorie der ¨ Diophantischen Approximationen, Math. Ann. 92 (1924), pp. 115–125.
[2] A. Y. Khintchine, Zur metrischen Theorie der Diophantischen Approximationen, Math. Zeitschrift 24 (1926), pp. 706–713.
[3] A. Y. Khintchine, Continued Fractions (1935).
[4] R. M. Solovay, A model of set-theory in which every set of reals is Lebesgue measurable, Ann. of Math. 92 (1970), pp. 1–56.
[5] Lý Ngọc Tuệ, Xấp xỉ Diophantine trên R và Liên phân số, Epsilon 4, (2015).
[6] Lý Ngọc Tuệ, Xấp xỉ Diophantine trên Rn- Quy tắc Dirichlet và Hình học của số, Epsilon 5, (2015).
31
Tạp chí Epsilon, Số 06, 12/2015
32
HÌNH HỌC RỐI LƯỢNG TỬ
Đàm Thanh Sơn
Được sự đồng ý của giáo sư Đàm Thanh Sơn, trong số này Epsilon trân trọng gửi đến độc giả bản dịch của giáo sư từ bài Geometría y entrelazamiento cuántico của Juan Maldacena, Investigación y Ciencia, số 11=2015. Bản gốc độc giả có thể xem tại trang nhà của giáo sư ở đây.
1. Giới thiệu
Vào đầu thế kỷ XX đã có hai cuộc cách mạng trong vật lý: Cơ học lượng tử và thuyết tương đối rộng. Cơ học lượng tử cho ta biết các định luật chi phối thế giới vi mô, còn thuyết tương đối rộng, được Einstein xây dựng năm 1915, là một lý thuyết về không gian và thời gian. Theo thuyết tương đối rộng, không-thời gian có độ cong và không phải tĩnh, mà là động.
Tới nay các tiên đoán của cả hai lý thuyết đều đã được thực nghiệm xác nhận. Tuy nhiên hai lý thuyết thường được áp dụng vào những hiện tượng rất khác nhau. Ta thường dùng cơ học lượng tử để mô tả các vật rất nhỏ (như nguyên tử hay photon), và dùng thuyết tương đối rộng để nghiên cứu sự thay đổi của không thời gian ở gần các vật nặng (ví dụ các ngôi sao hay các thiên hà). Để nghiên cứu các hệ vật lý vừa nặng vừa nhỏ, như vũ trụ ngay sau vụ nổ lớn, ta cần một cách miêu tả lượng tử cho không thời gian. Điều này, một trăm năm sau ngày Einstein xây dựng được thuyết của mình. vẫn còn là một thách thức lớn cho vật lý cơ bản.
Hai năm trước, được khích lệ bởi một cuộc tranh luận về các tính chất của lỗ đen, nhà vật lý Leonard Susskind của đại học Stanford và tác giả đã đề xuất ra một mối liên hệ giữa hai hiện tượng có vẻ nghịch lý trong cơ học lượng tử và thuyết tương đối rộng: Hiện tượng rối lượng tử (quantum entanglement) và lỗ giun (wormholes). Rối lượng tử là một dạng tương quan lượng tử có thể tồn tại giữa những hệ vật lý cách xa nhau. Lỗ giun là những đường tắt xuất hiện trong một số nghiệm của phương trình Einstein và nối những vùng rất xa nhau của không gian.
Dưới đây chúng ta sẽ thấy hai hiện tượng này có liên quan với nhau. Sự tương đương này tạm thời chỉ có có thể chứng minh chặt chẽ trong một vài trường hơp cụ thể, nhưng có lẽ đúng trong trường hợp tổng quát. Ý tưởng của chúng tôi về mối liên hệ giữa hình học và rối lượng tử có thể là một nguyên tắc mà tất cả lý thuyết lượng tử của không-thời gian, hay hấp dẫn lượng tử, phải tuân theo. Nguyên tắc này có những hệ quả quan trọng. Thậm chí, một cách nào đó, có thể chính không-thời gian cũng xuất hiện ra từ sự rối lượng tử của những thành phần vi mô cơ bản nhất của thế giới.
Một điều thú vị là cả hai khái niệm, rối lượng tử và lỗ giun, đều xuất phái từ hai bài báo mà bản thân Einstein viết vào năm 1935: Hai công trình dường như liên quan đến hai hiện tượng rất khác nhau, và sau này Einstein cũng không bao giờ nghĩ là chúng có thể có liên hệ gì với nhau. Thực sự mà nói, rối lượng tử là một hiện tượng làm cho Einstein hết sức bức bối. Dưới đây chúng ta sẽ xem lại hai bài báo và giải thích mội liên hệ của chúng từ quan điểm hiện đại.
33
Tạp chí Epsilon, Số 06, 12/2015
2. Lỗ đen và lỗ giun
Một tiên đoán đáng kinh ngạc của lý thuyết Einstein là lỗ đen. Lỗ đen được nhình thành khi ta gom một khối lượng vật chất lớn vào một vùng nhỏ của không gian. Vật chất này không cần là gì đặc biệt, ví dụ từ không khí ta cũng có thể tạo ra một lỗ đen. Chỉ có điều là cần rất nhiều không khí: Ta cần phải làm đầy một hình cầu có kích thước bằng kích thước của hệ mặt trời. Nếu ta làm được như vậy thì khối khí này sẽ suy sụp dưới sức nặng của mình và nén lại cho tới khi trở thành lỗ đen.
Tất cả các lỗ đen đều được bao bọc bởi một mặt cầu giả tưởng gọi là chân trời sự kiện. Ta gọi mặt cầu này là giả tưởng vì một nhà du hành vũ trụ rơi tự do vào lỗ đen sẽ không thấy gì ở chỗ này. Tuy nhiên, một khi vượt qua mặt cầu này, người đó sẽ không quay trở lại được. Người đó sẽ đi vào một vùng mà không gian suy sụp vào một “kỳ dị”, chỗ mà hình học co lại hoàn toàn. Tới gần điểm kỳ dị nhà du hành vũ trụ sẽ chết bẹp dưới lực hấp dẫn.
Bên ngoài vùng chứa vật chất, lỗ đen được mô tả bằng một nghiệm của phương trình Einstein mà nhà vật lý Karl Schwarzschild tìm ra năm 1916: Mục tiêu ban đầu của Schwarzchild là tìm trường hấp dẫn của một chất điểm. Trên thực tế, nghiệm của ông ta không có vật chất: Nó mô tả một trường hấp dẫn thuần tuý với đối xứng cầu, không hơn không kém. Tuy trông có vẻ đơn giản, các tính chất của không-thời gian này khá khó diễn giải. Chỉ đến những năm 196o người ta mới hiểu được tương đối cấu trúc toàn cục của nghiệm này.
Năm 1935; ở một trong hai bài báo đã nói đến ở trên, Einstein và Nathan Rosen, một cộng tác viên của Einstein ở Viện Nghiên cứu Cao cấp ở Princeton, tìm ra một khía cạnh rất thú vị của nghiệm Schwarzschild. Họ tìm ra rằng nghiệm này chứa hai không gian độc lập nối với nhà bằng một cái “ống”. Tại một thời điểm nhất định, ta có thể hìng dung ra hình học của nghiệm như sau: Ở xa vùng trung tâm, không gian là phẳng (không có độ cong đáng kể), nhưng khi vào gần trung tâm, hình học bị méo đi và nối vào một không gian thứ hai, một không gian cũng tiệm cận phẳng.
Sự kết nối hình học mà Einstein và Rosen tìm ra được gọi là “cầu Einstein-Rosen” .ER/; hay lỗ giun. Einstein và Rosen phân tích cấu trúc hình học của một siêu diện tại một thời điểm cố định (nói cách khác, một không gian cong ba chiều) nhiều năm trước khi ta hiểu được cấu trúc toàn cục của nghiệm Schwarzschild. Mục tiêu của Einstein và Rosen là tìm một miêu tả hình học cho một hạt cơ bản không có kỳ dị. Ngày nay chúng ta biết rằng diễn giải của họ là sai lầm.
Chiếc cầu nguyên thuỷ của ER nối hai không gian độc lập. Tuy nhiên, ta có thể có những nghiệm giống như vậy nhưng hai vùng được nối cùng thuộc về một không gian. Chỉ cần thay đổi một chút, nghiệm Schwarzchild có thể được diễn giải như là một nghiệm chứa hai lỗ đen ở rất xa
34
Tạp chí Epsilon, Số 06, 12/2015
nhau nhưng bên trong lại nối với nhau. Ta tưởng tượng là có một lỗ đen ở tại nơi ta đang sống và một lỗ đen ở một ngân hà khác. Một người quan sát mà ta sẽ gọi là Romeo đứng cách chân trời sự kiện của lỗ đen thứ nhất 1 mét, trong lúc Juliet đứng cách đứng cách chân trời sự kiện của lỗ đen thứ hai cũng 1 mét. Nếu ruột của hai lỗ đen được nối với nhau bằng một chiếc cầu ER; khoảng cách giữa Romeo và Juliet qua lỗ giun sẽ là 2 mét, bất kể hai vùng không gian xung quanh hai lỗ đen xa nhau đến mức nào.
Những kiểu hình học này có vẻ có vấn đề. Ta nhớ lại là một trong những nguyên lý cơ bản của thuyết tương đối hẹp là ta không thể gửi tín hiệu đi nhanh hơn tốc độ ánh sáng. Thế nhưng có vẻ là lỗ giun cho phép vi phạm nguyên lý này vì ta có thể gửi tín nhiệu qua nó. Tuy nhiên, năm 1963; Robert W. Fuller ở đại học Columbia và John A. Wheeler ở đại học Princeton đã chứng minh rằng không thể dùng cầu ER để gửi bất kỳ loại tín hiệu nào. Để thấy điều này ta phải xem xét tính chất động của hình học trong đó thời gian đóng một vai trò quan trọng. Lỗ giun của chúng ta mô tả hình học của không gian tại một thời điểm cố định. Nhưng hình học này tiến hoá theo thời gian. Fuller và Wheeler chứng minh được rằng chiếc cầu ER giãn ra – độ dài của cầu trở thành vô cùng – trước khi người quan sát kịp vượt nó. Điều này có thể sẽ làm các nhân vật trong các phim khoa học viễn tưởng thắt vọng, vì họ vẫn hay dùng lỗ giun để du hành trong vũ trụ với tốc độ lớn hơn tốc độ ánh sáng.
Trong trường hợp hai lỗ đen nối với nhau ở bên trong bằng một lỗ giun, chân trời của hai lỗ đen chạm vào nhau tại một khoảnh khắc, nhưng sau đó rời nhau ra quá nhanh để cho ai đó có thể kịp vượt cầu sang bên kia. Như thế nếu Romeo muốn gửi một thông điệp nhanh hơn tốc độ ánh sáng cho Juliet, anh ta sẽ không thể làm được. Romeo có thể phóng một tên lửa mang thông điệp vào lỗ đen bên anh ta và tên lửa sẽ rơi vào bên trong lỗ đen. Thuy nhiên, khi đã ở bên trong, hai chân trời chạy khỏi nhau với tốc độ rất nhanh, và không gian suy sụp trước khi thông điệp có thể tới chân trời của Juliet.
Tuy nhiên, Romeo và Juliet vẫn có cơ hội gặp nhau. Họ có thể nhảy, người nào vào những lỗ đen của người đấy, và gặp nhau ở bên trong lỗ đen. Tuy nhiên có một vấn đề: Một khi đã vào trong, họ không thể ra ngoài nữa. Đây là một trường hợp của “sự cuốn hút chết người”. Cái lạ của hình học này là nó mô tả hai lỗ đen có cùng chung một ruột. Vì thế mà Romeo và Juliet có thể gặp nhau ở trong lỗ đen.
35
Tạp chí Epsilon, Số 06, 12/2015
Ta phải nhấn mạnh là những lỗ giun của chúng ta rất khác những lỗ giun thường gặp trong các phim khoa học viễn tưởng. Những lỗ giun trong phim (những lỗ giun ta có thể đi qua được) đòi hỏi một loại vật chất có năng lượng âm, có lẽ không tương thích với các định luật vật lý ta biết. Vì vậy nhiều nhà vật lý tin rằng loại lỗ giun trong các phim khoa học viễn tưởng không thể tồn tại trong tự nhiên. Các lỗ đen ta xét ở đây còn có một khía cạnh khác đáng nhắc đến. Các lỗ đen được tạo ra do vật chất suy sụp chỉ tương ứng với một phần của hình học Schwarzchild, bởi vì sự có mặt của vật chất làm nghiệm thay đổi. Các lỗ đen loại này đã được nghiên cứu rất rõ; trong trường hợp này không có lỗ giun nào hết. Loại lỗ đen được tạo ra qua các quá trình vật lý thiên văn, ví dụ như khi một ngôi sao suy sụp, là loại không có lỗ giun nối với một vùng khác của không gian hay nối chúng với nhau, khác với nghiệm đầy đủ của Schwarzschild. Tuy vậy chúng ta vẫn muốn hiểu rõ hơn diễn giải vật lý của không-thời gian Schwarzschild. Dù sao, đây cũng là một trong những nghiệm đơn giản nhất của phương trình Einstein.
3. Tương quan lượng tử
Đáng ngạc nhiên là sự giải thích cho nghiệm Schwarzschild lại liên quan đến bài báo thứ hai của Einstein ta đã nhắc tới ở trên. Công trình này ngày nay rất nổi tiếng và có ảnh hưởng. Bài này được viết cùng năm, với đồng tác giả là Rosen và Boris Podolsky, cũng là nhà nghiên cứu của Viện Nghiên cứu Cao cấp. Các tác giả (ngày nay được biết đến bởi tên viết tắt EPR) chỉ ra là cơ học lượng tử cho phép một loại tương quan (correlation) rất lạ giữa các hệ vật lý xa nhau, một mối tương quan mà sau này được gọi là “rối lượng tử”.
Sự tương quan giữa các vật xa nhau có thể xảy ra ngay trong vật lý cổ điển. Giả sử bạn đi ra khỏi nhà mà chỉ mang theo một chiếc găng tay vì bạn quên chiếc kia ở nhà. Trước khi nhìn vào túi, bạn không biết mình mang chiếc nào đi. Tuy nhiên, một khi bạn nhìn vào túi và thấy mình mang chiếc găng phải, bạn biết ngay chiếc ở nhà là găng trái.
Tuy nhiên, rối lượng tử liên quan đến tương quan giũa các đại lượng lượng tử, những đại lượng có thể phải tuân thủ nguyên lý bất định của Heisenberg. Nguyên lý này nói rằng có những cặp biến số mà ta không thể biết hoàn toàn chính xác cùng một lúc. Thí dụ nổi tiếng nhất là vị trí và vận tốc của một hạt: Nếu ta đo chính xác vị trí thì vận tốc trở thành không xác định và ngược lại. Trong bài báo của mình, EPR hỏi cái gì sẽ xảy ra nếu ta có hai hệ ở xa nhau và trong mỗi hệ ta quyết định đo một cặp biến chịu nguyên lý bất định.
Trong ví dụ mà EPR phân tích, ta xét hai hạt có cùng khối lượng và chỉ chuyển động trong một chiều. Ta gọi hai hạt đó là R và J và ta chuẩn bị hai hạt đó sao cho trọng tâm của chúng có toạ độ xác định, tức là Xcm D xR C xJ D 0: Ngoài ra ta có thể làm cho vận tốc tương đối giữa hai hạt vrel D vR vl; có một giá trị chính xác, ví dụ vrel D v0: Trước khi tiếp tục, ta phải làm rõ một điều. Ta vừa đặt giá trị chính xác cho cả vị trí và vận tốc. Điều này có vi phạm nguyên lý bất định của Heisenberg không? Ta nhớ lại là nguyên lý bất định nói đến vị trí của một hệ và vật tốc liên quan đến vị trí đó. Tuy nhiên, nếu có hai hệ, không gì cấm ta biết vị trí của hệ thứ nhất và vận tốc của hệ thứ hai. Trong trường hợp đang xét, chúng ta không xác định vị trí và vận tốc của trọng tâm, mà là vị trí của trọng tâm và vận tốc tương đối của hai hạt. Do đây là hai đại lượng độc lập, không có vấn đề gì khi ta xét trạng thái ban đầu như EPR muốn.
Bây giờ ta gặp một điều rất bất ngờ. Giả sử hai hạt của chúng ta đã đi ra khỏi nhau rất xa và hai người quan sát xa nhau, Romeo và Juliet, quyết định đo vị trí của chúng. Do cách những hạt
36
Tạp chí Epsilon, Số 06, 12/2015
này được chuẩn bị, nếu Juliet nhận được giá trị xJ thì Romeo sẽ tìm được hạt của mình ở vị trí xR D xJ : Mặt khác, nếu họ đo vận tốc và Juliet nhận được kết quả xJ thì Romeo chắc chắn sẽ tìm được giá trị vR D v0 C vJ : Tất nhiên Romeo và Juliet muốn chọn đo đại lượng nào cũng được. Nhưng nếu Juliet đo vị trí và Romeo đo vận tốc, kết quả của họ sẽ hoàn toàn ngẫu nhiên và không có tương quan gì hết.
Cái lạ là nếu Juliet quyết định đo vị trí của hạt của mình thì hạt của Romeo sẽ có một vị trí hoàn toàn xác định một khi ta biết kết quả đo của Juliet. Cũng vậy nếu hai người đo vận tốc. Ta có thể nghĩ là khi Juliet đo vị trí, hạt của Romeo “biết” ngay lập tức là phải chiếm một vị trí xác định. Mới nhìn thì điều này có vẻ là một sự truyền thông tin tức thì: Lặp đi lặp lại thí nghiệm nhiều lầm, Juliet có thể gửi cho Romeo một thông điệp gồm số 0 và 1 bằng cách chọn đo vị trí hay tốc độ của hạt. Tuy vậy, Romeo không thể đọc được thông điệp nếu không biết kết quả đo của Juliet. Do đó ta không thể dùng tương quan do rối lượng tử để gửi tín hiệu nhanh hơn ánh sáng.
Rối lượng tử có thể là một tính chất bí mật nhất của các hệ lượng tử, tuy nhiên qua nhiều năm tháng đã được kiểm chứng bằng thực nghiệm. Trong hai mưoi năm trở lại đây, các tương quan lượng tử đã đưa đến những ứng dụng thực tế và những tiến bộ lớn trong các ngành như mật mã và thông tin lượng tử.
4. ER = EPR
Ta quay lại các lỗ đen. Năm 1974 Stephen Hawking chứng minh rằng các hiệu ứng lượng tử làm cho các lỗ đen phát ra bức xạ giống như một vật nóng. Điều này chứng tỏ các lỗ đen có nhiệt độ. Nhiệt độ này càng cao nếu vật càng nhỏ. Thật sự ra một lỗ đen có thể trắng. Cụ thể, một lỗ đen với kích thước bằng một vi khuẩn, với bức xạ có bước sóng giống như bước sóng của ánh sáng nhìn thấy, sẽ có màu trắng do bức xạ Hawking. Lỗ đen này không phát ra nhiều ánh sáng, nhưng đến gần nó ta sẽ thấy một điểm sáng chói. Nhưng một lỗ đen kích thước này có một khối lượng khổng lồ, do đó ta không thể sử dụng nó như một nguồn năng lượng.
Đối với những lỗ đen được tạo ra một cách tự nhiên từ sự suy sụp của một ngôi sao, bức xạ Hawking yếu đến mức trên thực tế không thể quan sát được. Những vật thể này quá to và quá lạnh để có thể cảm nhận được hiệu ứng này. Tuy nhiên, việc các lỗ đen có nhiệt độ có những hệ quả quan trọng.
Chúng ta biết từ thế kỷ XIX là nhiệt độ có được là do chuyển động của các phần tử vi mô trong hệ. Ví dụ, trong chất khí, nhiệt độ nảy sinh do chuyển động của các phân tử khí. Vì thế ta có thể chờ đợi là một lỗ đen có chứa những thành phần vi mô có khả năng tạo ra vô số các cấu hình, hay là “trạng thái vi mô”. Chúng ta cũng tin rằng, ít nhất nhìn từ bên ngoài, các lỗ đen cũng phải hành xử như những hệ lượng tử bình thường, chịu tất cả các định luật cơ học và nhiệt động học.
Xem xét từ bên trong, không có gì cấm ta xét các trạng thái rối lượng tử của các lỗ đen. Ta tưởng tượng hai lỗ đen cách xa nhau, mỗi lỗ đen có một số lớn các trạng thái vi mô. Ta có thể nghĩ ra một cấu hình trong đó mỗi trạng thái vi mô của lỗ đen thứ nhất có tương quan với trạng thái vi mô tương ứng của lỗ den thứ hai. Cụ thể là nếu ta quan sát được lỗ đen thứ nhất ở một trạng thái vi mô nhất định, thì lỗ đen thứ hai cũng ở đúng trạng thái này.
Điều hay là, xuất phát từ một số xem xét nhất định liên quan đến lý thuyết dây và lý thuyết trường lượng tử, ta có thể chứng minh rằng hai lỗ đen với các trạng thái vi mô rối với nhau như mô tả ở
37
Tạp chí Epsilon, Số 06, 12/2015
trên – tức là ở trạng thái EPR – sẽ cho ta một không thời gian trong đó có một chiếc cầu ER nối hai lỗ đen với nhau. Nói cách khác là rối lượng tử gây ra một liên kết hình học giữa hai lỗ đen.
Chúng tôi gọi cái này là sư tương đương giữa ER và EPR; hày ER D EPR; vì nó liên hệ hai bài báo của Einstein và cộng sự viết năm 1935: Từ quan điểm của EPR; các quan sát gần chân trời của hai lỗ đen có tương quan với nhau vì rối lượng tử. Từ quan điểm của ER; các đo đạc có tương quan với nhau do khoảng cách giữa hai hệ qua lỗ giun là rất nhỏ. Để xác lập sự tương đương, điều quan trọng là ta không thể gửi thông tin qua lỗ giun, cũng như ta không thể gửi thông tin dùng rối lượng tử.
Ta có thể nghĩ tới một tương lai xa khi hai gia đình thù địch muốn giữ Romeo và Juliet ở xa nhau. Họ gửi Romeo đến Tinh vân Tiên nữ và giữ Juliet ở dải Ngân hà. Tuy nhiên họ cho phép hai người trao đổi thông điệp và các cặp hệ lượng tử rối với nhau. Việc này sẽ đòi hỏi rấtt nhiều thời gian, nhưng chúng ta đang ở một tương lai mà tuổi thọ cao hơn hiện nay rất nhiều. Với sự kiên nhẫn, Romeo và Juliet có thể làm ra hai lỗ đen rối với nhau. Những lỗ đen này nhìn từ ngoài thì hoàn toàn bình thường, do đó hai gia đình không nghi ngờ gì. Tuy nhiên, sau khi làm ra hai lỗ đen, Romeo và Juliet có thể nhảy và bên trong và gặp nhau trong đó lần cuối cùng trước khi chết ở điểm kỳ dị.
5. Một nguyên lý phổ quát?
Những ý tưởng dẫn ta tới đây được nhiều nhà nghiên cứu phát triển qua nhiều năm, bắt đầu từ một nghiên cứu của Werner Israel của đại học Alberta. Công trình của tôi và Susskind được khích lệ bởi một nghịch lý được Ahmed Almheiri, Donald Marolf, Joseph Polchinski và James Sully, tất cả lúc đó đều ở đại học California ở Santa Barbara, phát biểu năm 2012: Ngược lại với những gì mọi người nghĩ trước đó, những nhà nghiên cứu này đưa ra ý kiến rằng hiện tượng rối lượng tử buộc ta phải thay thế chân trời sự kiện của một lỗ đen (một mặt cầu rất êm, theo lý thuyết của Einstein), bằng một rào chắn năng lượng cao không thể vượt qua. Từ quan điểm của mối liên hệ ER D EPR ta có thể giải quyết được nghịch lý này.
Sự tương đương ER D EPR gợi ý là bất cứ khi nào có rối lượng tử ta cũng có mối liên kết hình học. Điều này phải đúng kể cả trong trường hợp đơn giản nhất khi ta có hai hạt rối với nhau. Tuy nhiên trong trường hợp này mối liên kết hình học phải có cấu trúc rất nhỏ và rất lượng tử, rất không giống khái niệm hình học bình thường của chúng ta. Dù chúng ta còn chưa biết mô tả những hình học vi mô đó như thế nào, ý tưởng của chúng tôi là mối liên hệ ER D EPR cho ta một nguyên lý mà tất cả các lý thuyết hấp dẫn lượng tử phải tuân theo. Lý thuyết lượng tử hấp dẫn được nghiên cứu nhiều nhất là lý thuyết dây. Trong lý thuyết dây, mối liên hệ ER D EPR có thể được chứng minh một cách chặt chẽ trong một số trường hợp mà sự rối lượng tử có một dạng nhất định, tuy nhiên hiện nay không có sự đồng thuận là mội liên hệ này được thoả mãn trong tất cả các trường hợp.
Chúng ta đã thấy là sự rối lượng tử có thể, đúng nghĩa đen, kéo hai hệ xa nhau lại gần nhau. Ta cũng biết là hai vùng gần nhau của không gian có rối với nhau. Một cách tự nhiên, ta có thể nghĩ là không-thời gian, một cấu trúc liên tục, có thể bắt nguồn từ rối lượng tử, một tính chất rất lượng tử. Ý tưởng này đang là tiêu điểm của nhiều nhà nghiên cứu, nhưng còn chưa được tổng hợp lại thành một phát biểu chính xác.
38
LOGIC CỦA TOÁN HỌC ỨNG DỤNG I. I. Blekman, A. D. Myshkis, Ya. G. Panovko
Bài viết này được chúng tôi trích từ "Toán học Ứng dụng", nhà xuất bản Khoa học Kĩ thuật Hà Nội, 1985. Đây là bản dịch Việt ngữ của Trần Tất Thắng từ bản gốc ở tiếng Nga của ba tác giả I. I. Blekman, A. D. Myshkis, và Ya. G. Panovko (độc giả có thể đối chiếu thêm với tựa tiếng Anh của sách là “Mechanics and Applied Mathematics: Logics and Special Features of the Applications of Mathematics").
Phương hướng ứng dụng và lý thuyết trong phát triển toán học
Hai nguồn toán học cơ bản
Phương hướng ứng dụng và lý thuyết: Vị trí hiện nay của toán học ứng dụng sẽ trở nên rõ ràng hơn nếu như theo dõi sơ bộ con đường phát triển của bản thân toán học. Rõ ràng là động lực phát triển của toán học có hai nguồn cơ bản tồn tại một cách khách quan. Một là nguồn bên ngoài do việc cần thiết phải dùng các phương tiện toán học để giải những bài toán nằm ngoài phạm vi toán học, các bài toán của các khoa học khác, cả kỹ thuật, kinh tế, ... chính đây là nguồn đầu tiên về mặt lịch sử. Nguồn thứ hai là nguồn bên trong do việc cần thiết phải hệ thống hóa các sự kiện toán học đã khám phá được, giải thích các mối liên hệ giữa chúng với nhau, hợp nhất chúng lại bằng các quan niệm khái quát lý luận, phát triển lý luận đó theo các quy luật bên trong nó, chính nguồn này ở thời điểm đó đã dẫn tới chỗ tách toán học thành một khoa học. 1
Tất nhiên đôi khi cũng khó phân giới các nguồn này. Ví dụ những nguồn thúc đẩy nảy sinh do việc áp dụng các phương pháp của một lĩnh vực toán học và một lĩnh vực khác 2đôi khi lại rất giống các nguồn thúc đẩy thâu nhận được khi áp dụng các phương tiện toán học ở ngoài phạm vi của toán học. Mặt khác, việc hệ thống hóa có thể là do có những nhu cầu thực tiễn trực tiếp.
Vì vậy có thể là mạo hiểm nếu xác định quá chi tiết về ranh giới giữa hai nguồn đó. Tuy nhiên những đặc điểm của các nguồn đó và ảnh hưởng của chúng trong đại bộ phận các trường hợp vẫn dễ dàng nhận thấy được. Hai phương hướng phát triển của toán học ứng với hai nguồn đó được gọi là phương hướng ứng dụng và phương hướng lý thuyết (thuần túy).
Xin nhấn mạnh là ở đây muốn nói về những ảnh hưởng chiếm ưu thế trong việc xây dựng và phát triển của các phương pháp toán học, của các khái niệm và những khẳng định. Còn đối với bất kỳ
1Trong lời giới thiệu cho một cuốn sách phổ biến nổi tiếng của R.Courant và G.Robbins [28] đã nói: “Rõ ràng là sự vận động đi lên trong lĩnh vực toán học là do sự xuất hiện những nhu cầu mà ở mức độ nhiều hay ít đều có mang một tính chất thực tiễn. Nhưng một khi đã xuất hiện thì sự vẫn động ắt phải có những khuôn khổ nội tại của nó và vượt ra ngoài phạm vi của tính hữu ích trực tiếp. Chính vì vậy sự biến đổi hoàn toàn một khoa học ứng dụng thành khoa học lý thuyết đã thấy trong lịch sử cổ đại và ở ngày nay cũng không phải ở mức độ kém hơn: Người ta đã thừa nhận sự đống góp của các kỹ sư và các nhà vật lý vào toán học hiện đại.”
2Ví dụ áp dụng giải tích và toán học
39
Tạp chí Epsilon, Số 06, 12/2015
bản chất toán học nào đã được xây dựng thì vấn đề nó thuộc phương hướng nào - lý thuyết hay ứng dụng - thường là vô nghĩa. Nên quy phương pháp Bubnov - Galeckin hoặc khái niệm hàm delta của Dirac, hoặc công thức của Taylor thuộc về phương hướng nào? Chỉ có thể trả lời được những câu hỏi đó nếu muốn nói về lịch sử phát sinh các khái niệm đó hoặc về nhưng hoàn cảnh cụ thể trong đó đã bắt gặp chúng. Đúng là một số chương như đại số đồng điều chẳng hạn thì hiện nay hoàn toàn thuộc về phương hướng lý thuyết và một ít vấn đề như phương pháp chọn xác suất xác định khả năng thực tiễn của sự kiện, khái niệm về tính hội tụ thực tiễn hay vô hạn thực tiễn thì hiện thời hoàn toàn thuộc về phương hướng ứng dụng (ở đây không phải ngẫu nhiên mà có các từ “hiện nay, hiện thời”).
Giai đoạn đầu của phát triển toán học
Ở những giai đoạn phát triển sớm của toán học thì hai phương hướng này có thể thấy được đặc biệt rõ nét. Bởi vì lúc đấy các phương hướng này tác động lẫn nhau tương đối yếu nên thậm chí còn có thể nói được đó là hai ngành toán học hầu như tách biệt nhau - toán học ứng dụng và toán học lý thuyết (thuần túy).
Ví dụ toán học cổ Ai Cập công nhiên là toán học ứng dụng, nó liên hệ trực tiếp với việc đo đạc ruộng đất, tính toán thể tích các bình, tính đếm thực tiễn, tính thời gian (nói riêng là để dự đoán nhật thực và nguyệt thực), ... Toán học ở Mehico cổ đại và ở một số các dân tộc khác cũng có tính chất ấy. Toán học thuần túy có lẽ phát sinh lần đầu tiên ở Cổ Hy Lạp liên hệ với khoa học ngụy biện và tách hẳng khỏi toán học ứng dụng. 3 Chính khoa học Cổ Hy Lạp đã đề ra phương pháp suy diễn trong việc xây dựng lý thuyết. Theo phương pháp này thì mọi khẳng định trong lĩnh vực này hay khác đều có thể bằng những phương pháp khác của logic hình thức mà suy ra từ một số những khẳng định không chứng minh được gọi là tiên đề (chẳng hạn xem [30]). Kể từ đó phương pháp trình bày này được gọi là một trong những nét tiêu biểu quan trọng nhất của toán học (nếu không phải là một nét duy nhất). Tính chặt chẽ của phương pháp suy diễn đã gây được một số ấn tượng mạnh mẽ cho những thế hệ sau đến nỗi đã có những ý đồ (nói thêm là không thành) gắn hình thái suy diễn chặt chẽ cho các lĩnh vực tri thức khác. Ý đồ ấy thậm chí đã có cả triết học (“Đạo đức học” của B.Spinoza).
Xin lưu ý một tình tiết đáng chú ý là từ đó khoa học cổ Hy Lạp đã tiếp cận khái niệm vô hạn, tình tiết đó về sau đã được xóa bỏ và rồi lại được tái sinh ở mức cao hơn chỉ ở các công trình về logic toán học của thế kỷ XX. Khoa học cổ Hy Lạp không thừa nhận tính vô hạn thực tại và không thể tìm thấy ở một phát biểu toán học nào thời đó điều mà hiện nay được gọi là một tập hợp vô hạn hoặc một quá trình vô hạn. Một ví dụ tiêu biểu mệnh đề mà hiện nay được phát biểu là: “Tập hợp các số nguyên tố là vô hạn” thì Euclide phát biểu đại để là: “Nếu cho một tập hợp nào đó (hiểu ngầm là hữu hạn) các số nguyên tố thì còn ít nhất một số nguyên tố nữa” . Ở đây có
3Về điểm này F.Klein [29, tr. 146 147] đã viết rõ “Nếu bắt đầu từ những người Hy Lạp cổ thời ta sẽ thấy có sự phân giới rõ rệt giữa toán học thuần túy và toán học ứng dụng từ thời Paton và Aristotel. Thuộc toán học thuần túy trước hết có phép dựng hình Euclide quen thuộc. Thuộc toán học ứng dụng đặc biệt có các phép toán về số gọi là logictic . ı là số chung nhất). Ở đây toán học ứng dụng khá bị thành kiến coi thường và trong nhiều trường hợp vẫn còn đến tận ngày nay, nhưng đại bộ phận chỉ thấy ở những người tự mình không biết tính toán. Tình hình này của logictic có thể phần nào do nó được phát triển trong mối liên hệ với lượng giác và với những nhu cầu đo đạc thực tiễn ruộng đất mà thời xưa là do những người làm những nghề không được cao quý lắm thực hiện. Tất nhiên nó lại đã được phục hồi một phần nào là do nếu thiếu nó thì không thể làm được khoa học khác, tuy có giống như trắc địa nhưng lại ngược với nó ở chỗ luôn luôn được coi là một trong những khoa học cao quý nhất: Đó là thiên văn học”.
40
Tạp chí Epsilon, Số 06, 12/2015
thể thấy có sự tương tự trực tiếp với khái niệm tính tiếp tục được không hạn chế là khái niệm mà một trong những phương hướng hiện đại của logic toán đã được thừa nhận là thay thế khái niệm tính vô hạn thực tại.
Mọi người đều biết rằng không thừa nhận tính vô hạn thực tại sẽ kéo theo những khó khắn nhất định về mặt logic (về điểm này ta nhớ lại những ngụy biện của Zenon) mà người Hy Lạp nói chung đã thấy rõ khi họ nhận xét rằng không gian và thời gian có thể phân chia được vô hạn nhưng về mặt hiện thực thì không thể phân chia được vô hạn như vậy. Dưới đây sẽ còn thấy rằng thừa nhận vô hạn thực tại còn kéo theo những khó khăn không những lớn hơn về mặt logic mà còn cả những khó khăn thực tiễn nữa.
Những biểu hiện cao nhất về tính chặt chẽ trong toán học cổ Hy Lạp là lý thuyết các tỷ lệ và phương pháp vét cạn của Evdocs tương tự như lý thuyết tương tự như lý thuyết hiện đại về số thực và phương pháp chuyển qua giới hạn nhưng khác ở chỗ là ở người Hy Lạp không thấy nói đến những tập hợp vô hạn các quá trình vô hạn. 4
Tuy nhiên cùng với những kiệt tác này về tính chặt chẽ, trong logic của toán học Hy Lạp còn có cả những lỗ hỗng mà theo quan điểm hiện nay thì quá rõ ràng. Ví dụ những định nghĩa ban đầu về các khái niệm điểm, đường thẳng, ... thực chất không phải là các định nghĩa (“điểm là cái không có bộ phận, ...” ) và về sau đã không được nhắc tới nữa. Các tiền đề chỉ bao hàm các mối tương quan giữa các đại lượng nhưng không phải tất cả các mối quan hệ đã được dùng đến. Hoàn toàn không có những định nghĩa và các tiên đề liên quan tới khái niệm thứ tự các điểm trên một đường thẳng hoặc trên một đường tròn, tức là khái niệm này dường như thuộc về số các từ (giống như “cho trước”, “người ta cho” , ...) được ngầm hiểu khi xây dựng lý thuyết. Ngoài ra điều đáng chú ý là những người Hy Lạp đã tính toán chiều dài, diện tích, thể tích của các đường thẳng, các hình, các vật thể khác nhau và đôi khi khá phức tạp những vấn đề về bản thân sự tồn tại độ đo ấy thì lại không được đặt ra, ...
Trong khi đó người Hy Lạp (Archimede nói riêng) đã dùng cả các phép chứng minh dựa trên những tương tự một cách máy móc, song những phép chứng minh ấy bị coi là không chặt chẽ, chỉ có tính chất chuẩn bị, và những khẳng định thu nhận được nhất thiết về sau phải được chứng minh một cách chặt chẽ (chúng tôi sẽ còn quay lại khái niệm tính chặt chẽ trong toán học).
Có lẽ sự tách biệt rõ nét giữa toán học thuần túy và toán học ứng dụng cũng là nét tiêu biểu cho các nước đạo Hồi thời Trung cổ. Ở đây lý thuyết và thực tiễn giải các phương trình đại số cũng như giải tích tổ hợp ngày càng ăn nhập sâu vào toán học thuần túy, nói riêng, những phát minh toán học lớn hồi đó như các hệ số nhị thức, các công thức giải phương trình bậc 3 và bậc 4 thì hoàn toàn thuộc về toán học thuần túy.
4Không loại trừ một việc là do chính đã phát hiện được rất sớm những khó khắn liên quan tới những đại lượng vô ước nên đã khiến người Hy Lạp không phát triển nghiên cứu các phép toán về số mà trong những thời đại trước đã đạt được những thành tựu đáng kể ở Phương Đông. Thay vào đó họ đã đi tìm phương hướng trong con đường rối ren của hình học tiên đề thuần túy. Thế là bắt đầu một trong những nỗ lực mò mẫn kỳ lạ trong lịch sử khoa học và có thể ở đây những khả năng sáng chói đã bị nhỡ nhằng. Hầu như trong hai thiên niên kỷ ảnh hưởng của truyền thống hình học Hy Lạp đã kìm hãm sự tiến hóa tất yếu của quan niệm về số và về phép tính bằng chữ mà sau này đã trở thành nền tảng của khoa các học chính xác [28, Lời giới thiệu]
41
Tạp chí Epsilon, Số 06, 12/2015
Phục hưng khoa học
Với giai đoạn đầu của thời kỳ Phục hưng khoa học, tình hình đã thay đổi về cơ bản, từ những công trình của G.Galilei, I.Kepler và của các nhà khoa học khác. Đối với họ, toán học là phương tiện tư duy toán học đã trở thành một trong những vũ khí chính của khoa học tự nhiên. Áp lực mạnh mẽ của khoa học tự nhiên đã có tác dụng rất tốt đối với sự phát triển của toán học. Trong những thế kỷ XVI - XVIII cả hai phương hướng ứng dụng và lý thuyết đã liên tục tác động lẫn nhau. Một khung cảnh điển hình là sự ra đời và phát triển của khái niệm toán học phục thuộc vào những bài toán của khoa học tự nhiên hay của hình học (lúc đó những ứng dụng vào hình học ít được phân biệt với những ứng dụng vào cơ học hay quang học), và sau khi khái niệm đó đã được xây dựng thì chẳng bao lâu nó đã có một cuộc sống độc lập và tiếp tục được phát triển theo những quy luật nội tại của toán học. Một số những kết quả của sự phát triển “thuần túy” đó lại được áp dụng vào khoa học tự nhiên và điều này lại làm xuất hiện những khái niệm và bài toán toán học nữa. Ví dụ rõ ràng và mọi người đều biết về sự phát triển ấy là việc hình thành các phép tính vi phân và tích phân.
Trong thời “hoàng kim” này của phát triển toán học một cách hài hòa thì sự tách biệt và hơn nữa, sự đối lập giữa toán học thuần túy và toán học ứng dụng trở nên mất hết cả ý nghĩa. Có được điều đó cũng còn là do các nhà khoa học lớn thời kỳ đó như N.Newton, L.Euler, J.Lagrange và những người khác không chỉ là các nhà toán học mà còn là nhà vật lý, các nhà cơ học nữa. Trong các công trình của mỗi nhà khoa học đó đã phát triển cả phương hướng lý thuyết lẫn phương hướng ứng dụng của toán học.
Thời kỳ thống trị của phương hướng lý thuyết tập hợp
Thời kỳ quá độ sang giai đoạn tiếp sau đã kéo dài nhiều thập niên và vì vậy chỉ có thể quy ước cho rằng thời gian bắt đầu thời kỳ đó là thế kỷ XIX. Nó liên hệ với hàng loạt các công trình xuất sắc nhất về lý thuyết tập hợp (G.Cantor) và lý thuyết hàm (K.Weierstrass), về xây dựng các cấu trúc đại số trừ tượng đầu tiên và phân tích các tiên đề hình học. Các công trình nổi tiếng và tiến bộ sâu sắc thời kỳ đó đã biến một bộ phận đáng kể của toán học thành một khoa học thống nhất có những yêu cầu thống nhất về các định nghĩa, các khẳng định và các phép chứng minh và có những tiêu chuẩn thống nhất về tính chặt chẽ.
Nguyên nhân chủ yếu của giai đoạn quá độ này là do cuối thời kỳ trước trong toán học đã tích lũy nhiều sự kiện, đã ra đời hàng loạt các lý thuyết không thống nhất với nhau và không có những cơ sở lập luận vững chắc là điều có thể phát triển những lý thuyết đó một cách tin tưởng. Sự phát triển tiếp sau của các bộ môn giải tích trong đó đã tự phát ra đời phương pháp dựa trên việc áp dụng vô hạn thực tại - các chuỗi vô hạn, những đại lượng vô cùng bé - đã đòi hỏi phải xác định rõ ràng những khái niệm về hàm số và về việc chuyển qua giới hạn, điều đó tất nhiên đã kéo theo sự ra đời của lý thuyết số thực và lý thuyết các tập hợp số, ... Quan điểm lý thuyết tập hợp đã cho phép phát biểu được rõ nét khái niệm nhóm, môt khái niệm quan trọng nhất trong đại số học và đã dẫn tới một kết cấu logic của hình học thỏa mãn những người đương thời. 5
5Như P.S.Aleksandrov đã viết trong lời nói đầu của cuốn sách [31]: “Lý thuyết tập hợp và những ứng dụng gần gũi nhất của nó không những chỉ hình thành một đối tượng nghiên cứu mới của toán học, ý nghĩa của lý thuyết tập hợp dường như vô cùng to lớn vì nó đưa ra một phương pháp tổng hợp mới bao trùm nhanh chóng toàn bộ toán học”. Tất nhiên ở đây là nói về toán học thuần túy.
42
Tạp chí Epsilon, Số 06, 12/2015
Như vậy bước chuyển tiếp trong toán học sang quan điểm lý thuyết tập hợp dựa trên cơ sở, như hiện nay vẫn nói một cách khoan dung của lý thuyết tập hợp ngây thơ 6là sự cần thiết và vì vậy là tiến bộ. Trong khi đó việc sắp xếp thứ tự các cơ sở của khoa học, những khả năng mới và to lớn đã khám phá được qua việc đó, nói riêng những khả năng khá mạnh mẽ của sự tương tác giữa các bộ môn khoa học khác nhau 7đã thực sự nâng cao vai trò của phương hướng lý thuyết trong toán học mà trong giai đoạn này (kéo dài mãi tới chiến tranh thế giới thứ hai) đã chiếm ưu thế và quyết định phong cách của toàn bộ toán học nói chung.
Còn đối với phương hướng ứng dụng thì nó tiếp tục được phát triển trước hết trong mối liên hệ với sự phát triển của vật lý học và cơ học thiên thể song có lẽ ở đây không có một bước ngoặt nào cả. Thời kỳ này đã mở ra những con đường ứng dụng mới, chẳng hạn như đại số vector và giải tích, đại số tenxơ và giải tích và về sau còn có cả phép tính toán tử, lý thuyết hàm suy rộng, ... nhưng bản thân tính chất của những ứng dụng thì trong một thời gian nào đó về nguyên tắc vẫn như cũ. Bộ máy toán học cổ điển kết hợp với những quan niệm sâu xa về mặt vật lý đã dẫn tới chỗ thực hiện được nhiều khám phá nổi tiếng, như người ta vẫn viết trong các sách phổ biến rằng “đầu nhọn của ngòi bút” những ví dụ loại này được mọi người biết đến rộng rãi là sự tiên đoán về các sóng điện từ của C.Maxwell, việc khám phá ra các hành tin Neptun và Pluton, sự tiên đoán của P.Dirac về Positron, ... Trên cơ sở này đã ra đời một trong những lĩnh vực quan trọng nhất của khoa học ngày nay là vật lý lý thuyết.
Những thành tựu của phương hướng lý thuyết, việc xây dựng một mức chặt chẽ thống nhất cho toàn bộ toán học đã dẫn tới phương hướng giải các bài toán toán học ra đời trong những ứng dụng cũng ở mức chặt chẽ của phương hướng lý thuyết. Biểu hiện rõ nhất của khuynh hướng này thấy ở D.Holbert và A.M.Liapunov mà chúng tôi sẽ nói chi tiết sau. Trong một số các trường hợp, khuynh hướng này đã tỏ ra có thể thực hiện được và ngoài ra điều đó đã dẫn tới tính đối ngẫu khi giải một bài toán ứng dụng nói chung bởi vì việc đặt bài toán và biểu thị phép giải được tiến hành ở mức chặt chẽ vật lý (những cố gắng trong việc tiên đề hóa từng chương riêng lẻ của vật lý trên cơ sở lý thuyết tập hợp dường như không thành công cho nên ở đây không thể tránh khỏi mực chặt chẽ vật lý) những phép giải toán học lại được thực hiện ở mức chặt chẽ toán học (sự phân biệt này chính là đặc trưng cho thời kỳ này bởi vì ở thời kỳ “hoàng kim” thì các mức chặt chẽ rất gần nhau nếu không phải trùng nhau). Trong những trường hợp phức tạp hơn cũng như khi các nhà vật lý giải những bài toán toán học ứng dụng thì trong phép giải thường có những luận cứ về vật lý, song các nhà toán học thì coi phép giải như vậy là không được đầy đủ và tìm cách thay nó bằng phép giải hoàn toàn đạt mức chặt chẽ “Weierstrass”. Thế là có một sự phân đôi nữa về “nghề nghiệp” giữa những yêu cầu về mức chặt chẽ của phép giải một bài toán ứng dụng của các nhà toán học và các nhà ứng dụng.
Góp phần vào việc phân đôi này còn có thể có mặt các phép tính toán mà mọi người đều biết là hầu như không bao giờ thực hiện được đầy đủ ở mức chặt chẽ “Weierstrass”. Song rút ra khỏi những ứng dụng truyền thống của Euler và của những nhạc trưởng khác trong thời kỳ “hoàng kim” các nhà toán học của phương hướng lý thuyết tập hợp đã ngừng việc tính toán và hoạt động này được đặt ra các nhà thiên văn học, các nhà pháo binh, ... cũng như cho một nhóm không lớn
6Nó đối lập với một quan điểm hiện đại hơn dựa hoàn toàn vào các phương pháp của logic toán. 7Ví dụ chỉ dựa trên cơ sở lý thuyết tập hợp mà đã đưa ra cách lập luận theo tiên đề cho lý thuyết xác suất ở mức các lĩnh vực khác của toán học thuần túy. Những thành tự này đã dẫn tới một số các quan điểm cực đoan, ví dụ F.Doob [32, tr.7] đã viết: “Lý thuyết xác suất chỉ là một ngành của lý thuyết độ đo và khác ở chỗ nó đặc biệt chú ý tới một số các khái niệm chuyên môn của lý thuyết ấy và ở lĩnh vực ứng dụng đặc biệt của nó”. Có lẽ trên cơ sở đó cũng có thể nói được rằng văn học là một ngành ngôn ngữ học “khác ở chỗ nó đặc biệt chú ý tới, ...”
43
Tạp chí Epsilon, Số 06, 12/2015
các chuyên gia tính toán là những người được coi là đứng ở một chỗ nào đó giữa các nhà khoa học và các kỹ sư. Những thành tựu mà đại bộ phận các nhà toán học đạt được trong lĩnh vực này đã không được coi trọng và trong mọi trường hợp chúng bị coi là hoàn toàn không so sánh được với những thành tựu đáng ngạc nhiên của phương hướng mới.
Hoàn toàn mới gần đây, trong những bài giảng của một trong những nhà đại số học nổi tiếng đã có nhấn mạnh một cách hệ thống đến sự khác nhau chủ yếu giữa khoa học và “tính toán”8.
Xin lưu ý là về sau, khi toán học tính toán đã trở thành mốt rồi thì lại diễn ra sự phân tầng tiếp sau: Theo cách diễn tả hóm hỉnh của R.S.Guter [1, tr.13] thì “những người làm việc trong lĩnh vực toán học tính toán chia thành những người chứng minh tính hội tụ của các quá trình tính toán và sự tồn tại của nghiệm và những người áp dụng các quá trình tính toán và tìm lời giải”. Chính những người sau đã trực tiếp phục vụ hữu ích cho các khoa học ứng dụng.
Còn đối với mức chặt chẽ đạt được dựa trên cơ sở lý thuyết tập hợp ngây thơ và trong giải tích toán thì dựa trên lý thuyết giới hạn mô tả bằng cái gọi là ngôn ngữ - 9thì dường như nó thực tiễn đã thu hút được tất cả các nhà toán học. Đúng là cũng có những người “không hài lòng” (ví dụ L.Brauer, G.Weyl, ...) nhưng trong hoạt động thực tiễn thì họ cũng sử dụng mức chặt chẽ ấy. Ở chỗ này chỗ khác nơi chân trời cũng đã có thấy những mâu thuẫn trong lý thuyết tập hợp nhưng đại bộ phận các nhà toán học chỉ thấy đó chỉ là chuyện buồn cười không đáng khó chịu bởi vì nó chỉ đụng đến những con ngáo ộp không ai cần đến như tập hợp của tất cả các tập hợp, hoặc tập hợp của tất cả các tập hợp không chứa chính nó, ... Cuộc thảo luận về tiền đề chọn (tiên đề Zermelo) đã kết thúc với thỏa thuận rằng để tránh được nó, nếu có thể, thì trong trường hợp ngược lại phải chỉ ra rõ ràng việc áp dụng nó, tất nhiên nếu nghĩ cẩn thận thì sự thỏa thuận đó quả là có ngây thơ vì dường như những chỉ dẫn như vậy có làm thay đổi một cái gì đó. Trong những năm gần đây trong những công trình về toán học thuần túy, tiên đề chọn có được sử dụng quá rộng rãi, thậm chí những mệnh đề được chứng minh bằng tiên đề đó đã được ứng dụng một cách có hệ thống, điều đó khiến người ta có ấn tượng khá rõ ràng là có sự tùy tiện đối với tiên đề đó.
Những thành tựu của những phương hướng lý thuyết tập hợp, ngôn ngữ và phương pháp của nó đã trở thành quen thuộc đối với một vài thế hệ các nhà toán học và đã tạo ra một quan niệm về mức chặt chẽ đạt được dường như tuyệt đối. Nhiều nhà toán học (và nhất là những người không phải là toán học) hiện nay vẫn có thói quen tin tưởng vào tuyệt đối và chỉ đưa vào toán học những mệnh đề được chứng minh “chặt chẽ tuyệt đối”, những bài toán được đặt ra một cách “chặt chẽ tuyệt đối”, ...
8Cuốn sách hữu ích của C.Lanczos [33] đã bắt đầu bằng những lời như sau: “Trong nhiều năm tác giả đã nghiên cứu các lĩnh vực của giải tích toán là những lĩnh vực trước hết được sự quan tâm của các kỹ sư và các nhà vật lý học. Việc lĩnh vực này của toán học làm việc trong suốt thế kỷ XIX không được chú ý như những công trình cổ điển của giải tích có lẽ là kết quả của một quan niệm sai lầm về mặt lịch sử. Cho mãi tới thời Gauss và Legendre, các phương pháp làm việc của giải tích mới thu hút được sự chú ý của các nhà toán học nổi tiếng. Phát minh về lý thuyết giới hạn đã làm thay đổi tình hình. Kể từ thời gian đó việc đưa ra một quá trình xấp xỉ vô hạn để có thể xác lập được tính đúng đắn của các kết quả giải tích xác định độc lập với việc quá trình áp dụng đó có được thực hiện trong bài toán hay không, đã được coi là thỏa đáng. Kết quả là đã dần dần phân cách toán học thuần túy và toán học ứng dụng và như vậy là ta có các nhà giải tích thuần túy phát triển tư tưởng của họ trong thế giới trong thế giới kết cấu thuần túy lý thuyết và các nhà giải tích số là những người chuyển các quá trình giải tích thành các phép tính toán trên máy.”
9Cách nói “Đối với một > 0 bất kỳ tìm được số n”, “với bất kỳ > 0, tìm được ı” đã trở thành quá quen thuộc đến nỗi chữ biến thành dấu hiệu dường như chỉ mức chặt chẽ “Weierstrass”.
44
Tạp chí Epsilon, Số 06, 12/2015
Quan điểm về hiện đại
Trong lời giới thiệu đã có nói về nét “đặc thù toán học” trong giai đoạn hiện nay, một giai đoạn có liên hệ với sự mở rộng một cách mạnh mẽ ngoại vi và khối lượng của những ứng dụng toán học và mặt khác với sự xuất hiện và phát triển kỹ thuật tính toán điện tử là cái đã làm tăng nhiều lần tính hiệu lực của các ứng dụng đó. Rõ ràng là ngay cả bên trong toán học trong những năm gần đây cũng đã có những thành tựu xuất sắc, về sau chúng tôi sẽ nói tới một số những thành tựu đó. Song nếu xét sự phát triển của khoa học chẳng hạn như trong 30 năm lại đây theo lập trường của nền văn minh nói chung thì những thành tựu “bên ngoài” của toán học sẽ thấy là lớn hơn nhiều. Nói cách khác, hiện nay chính sự phát triển của phương hướng ứng dụng trong toán học (xét trong tất cả những biểu hiện của nó) đã trở nên trội hơn. Rõ ràng là trong thập niên tới đây, ưu thế này sẽ được bảo đảm và thậm chí sẽ còn được đẩy mạnh nữa.
Điều đó cho phép nói được rằng sau những giai đoạn phát triển của toán học mà đã có thể quy ước gọi được là giai đoạn tiền hy Lạp, giai đoạn Hy Lạp, phục hưng và giai đoạn lý thuyết tập hợp, ta đã bước sang một giai đoạn mới về chất của việc “toán học hoá tổng quát”. Có thể quy ước đánh dấu giai đoạn đầu của thời kỳ này là từ những năm 40 của thế kỷ XX (thời gian xây dựng những máy tính điện tử đầu tiên). Bước chuyển mình về chất trong toán học đã và đang kéo theo những biến đổi về chất trong nhiều lĩnh vực của khoa học tự nhiên, kỹ thuật, của các khoa học và đời sống xã hội.
Nếu dùng các thuật ngữ trong lịch sử phát triển xã hội thì có thể gọi giai đoạn hiện nay là giai đoạn “lưỡng quyền” (trong thời kỳ quá độ sang giai đoạn dân chủ).
Một mặt toán học của phương pháp lý thuyết tập hợp vẫn tiếp tục phát triển. Sự kết hợp, phát triển và hình thành những quan niệm mới của đại số học, của tôpô đại cương và tôpô đại số, của giải tích cổ điển và giải tích hàm, của lý thuyết hàm và hình học đã cho phép xây dựng được những chương mới, chín muồi của toán học, cho phép tiến hành những khái quát suy rộng và tìm ra những phương pháp mới cho các bài toán cũ và đã giải được nhiều những bài toán đó, cho phép nêu lên các lớp những bài toán mới đáng chú ý. Một sự kiện nổi bật là việc xây dựng giáo trình “Cơ sở toán học” gồm nhiều tập của N. Bourbaki, mục đích của giáo trình này là xây dựng một cơ sở tổng quát, một nguồn tư liệu bằng một ngôn ngữ thống nhất để có thể tiếp tục phát triển được toán học theo lý thuyết tập hợp. 10 N. Bourbaki còn chưa đề cập đến nhiều chương của toán học (nhưng thật đã vĩ đại!) và rất có thể cả những chương ấy sẽ không tránh được sự “Bourbaki hoá”. Hiện nay khuynh hướng này của toán học thuần tuý đang vang lên một thanh điệu lất át các thanh điệu khác.
Tuy nhiên trong những thập niên gần đây người ta còn thấy cả những mặt yếu của khuynh hướng này. 11 Điều đó biểu thị theo hai tuyến – logic toán và những ứng dụng. Tuy nhiên , như đã thấy, chúng lại có liên hệ với nhau. Trước hết, tính chặt chẽ “tuyệt đối” của lý thuyết tập hợp ngây thơ và những lý thuyết lấy nó làm cơ sở dường như không hoàn toàn là tuyệt đối và điều này có thể thấy được từ những luận cứ chung nhất vì nó không thể không cần đến các nhà logic học. Không phải mọi người đều nghĩ rằng ở lý thuyết tập hợp ngây thơ không có một hệ thống hợp lý các tiên
10Chi tiết xem [34].
11W.Spohn đã nói về sự nguy hiểm đối với toán học hiện đại và xu hướng nghiêng về phía các chương trừu tượng nhất và kết luận rằng : “Hãy để cho toán học quay về hướng phát triển chính của nó để nó có thể trở thành của cải chung của mọi người và chiếm một vị trí thích đáng với nó với tinh cách một lực lượng thống trị trong xã hội của chúng ta”.
45
Tạp chí Epsilon, Số 06, 12/2015
đề làm cơ sở và nó chỉ dựa vào sự “dễ thấy” và những đường ngăn cấm tuỳ tiện, ví dụ được phép coi tập hợp tất cả các số tự nhiên là có lực lượng nhưng cấm không được coi tập hợp tất cả các số thứ tự (siêu hạn) hay tập hợp tất cả các bản số là có lực lượng. Việc phân tích của các nhà logic về hệ thống các tiên đề của lý thuyết tập hợp, một hệ thống đã đưa ra một thứ tự nào đó, đã chứng minh rằng một số các lập trường quan trọng nhất “tự nó đã được giải quyết” (ví dụ tiên đề chọn) mà thực ra có thể hoặc chấp nhận hoặc không và điều đó có thể dẫn tới sự cùng tồn tại bình đẳng các “môn toán học lý thuyết tổng hợp” khác nhau, không tương đương với nhau tựa như các môn hình học khác nhau vậy. Sự độc lập của giả thiết continum với các tiên đề khác của lý thuyết tập hợp được phát hiện tròn các công trình của K. Gidel và P. Cohen (1960) cond có hiệu lực hơn : nó có nghĩa là khi xây dựng một lý thuyết như vậy thì hoặc có thể chấp nhận giả thiết này như là một tiên đề bổ sung, hoặc chấp nhận một khẳng định trái ngược như một tiên đề, nhưng từ đó suy ra rằng vấn đề giả thiết continum “thực ra” có đúng hay không lại là vô nghĩa ! (xem vấn đề này ở [39]). Nói riêng, phát kiến nổi tiếng này đã chứng minh rằng khái niệm tồn tại mà lý thuyết tập hợp ngây thơ bám chắc vào thực ra không phải tự nó đã được giải quyết.
Song theo quan điểm đang được phát triển thì điều còn quan trọng hơn là mặt yếu ớt của toán học lý thuyết tập hợp đối với những ứng dụng. Chúng ta sẽ không than phiền rằng tất cả những khẳng định của nó đều thuộc cái ngẫu nhiên khi một bài toán ứng dụng đã được chuyển hoàn toàn sang ngôn ngữ toán học. Điều tồi hơn là trong nhiều trường hợp, điều khẳng định về nghiệm chỉ có tính chất thuần tuý về tồn tại, tức là chứng minh được định lý về sự tồn tại của nghiệm chứ trong định lý đó không hề nói gì đến việc nghiệm đó có thể tìm thấy một cách chính xác hay xấp xỉ.
Mặc dầu đôi khi kết cấu của nghiệm có thể suy ra được từ phép chứng minh định lý nhưng điều này thường gây thất bại, cho nên, nói vui một chút thì người ứng dụng giống như ở vào hoàn cảnh của một người đàn ông đã đăng ký kết hôn với một người phụ nữ mà anh ta chưa hề được trông thấy và cũng không biết nàng ở đâu nữa. Theo cách nói rất đúng của H. Weyl thì “Toán học là một kho tàng khổng lồ trong bản vị tiền giấy”. [40, tr. 106]. Trong nhiều trường hợp, kết cấu được coi là kết quả thực hiện một quá trình vô hạn này hay khác mà không phân tích phép xấp xỉ hữu hạn của nó. Nếu như công thức xấp xỉ dùng để giải có kèm theo sự đánh giá về sai số thì, trừ những trường hợp quá giản đơn hoặc những ví dụ được lựa chọn đặc biệt để giảng dạy, sự đánh giá ấy thường không áp dụng được hữu hiệu trong những ví dụ cụ thể hiện thực (ấy là chưa nói rằng trong đại bộ phận các đánh giá lại có tính chất gần đúng và bao gồm cả những nhân tử hằng số chưa biết). Những tính toán hằng số, nhất là trên máy tính điện tử có phần đóng góp của nó bởi vì thực hiện sự đánh giá “tuyệt đối chặt chẽ” về ảnh hưởng của việc làm tròn số trong những phép tính cồng kềnh tỏ ra lại rất khó khăn và vì vậy sự đánh giá này thực tế chưa hề bao giờ được làm cả.
Những tiêu chuẩn cứng ngắc về mức độ chặt chẽ của toán học lý thuyết hiện đại đã dẫn tới chỗ làm trì trệ không đáng mong muốn đối với việc nghiên cứu các khái niệm toán học mà thoạt đầu không thoả mãn những tiêu chuẩn đó, ví dụ như hàm denta, entropi, ...
Tất cả những điều kiện nhận xét trên đây dẫn tới một tình hình là trong đại bộ phận những nghiên cứu ứng dụng thì những lập luận toán học tuyệt nhiên không ở mức suy diễn thuần tuý mà toán học thuần tuý đòi hỏi, chúng không thể và không cần phải ở mức đó như chúng tôi sẽ nói chi tiết ở dưới đây về vấn đề này. Có thể nói rằng những kết cấu suy diễn không theo kịp nhịp điệu của cuộc sống hiện nay 12 và trong quá trình tiếp cận đến chân lý thì chúng thường có một hiệu suất
12“Nếu như ngay từ đầu khoa học đã được phát triển bởi những bộ óc chặt chẽ và tinh vi có ở một số các nhà toán 46
Tạp chí Epsilon, Số 06, 12/2015
quá thấp đến nỗi những nhà ứng dụng đã tự phát tìm ra một biện pháp hữu hiệu hơn nhiều cho các lập luận toán học 13 mà chúng tôi sẽ nói chi tiết ở dưới. Những biện pháp lập luận ở mức chặt chẽ “vật lý”, “ứng dụng” đối với các nhà ứng dụng thuộc các phương hướng khác nhau là khá giống nhau. Những biện pháp ấy cũng đặc trưng cho phong cách lập luận của toán học ứng dụng, nó cũng phổ biến trong các nhà ứng dụng như là phong cách suy diễn phổ biến trong các nhà toán học thuần tuý. Đó chính là điều đã đề cập tới ở phần trên khi nói về sự “lưỡng quyền”. 14
Cần phải đặc biệt lưu ý rằng các phương hướng ứng dụng đã ảnh hưởng đáng kể đến toàn bộ toán học hiện đại nói chung kể cả phương hướng lý thuyết của nó. Nói riêng chính điều này đã giải thích sự đặc biệt chú ý đến vấn đề thuật toán hoá cũng như vấn đề tối ưu hoá đặc trưng cho toán học hiện đại và đã có vết tích biểu hiện ở lĩnh vực đa dạng của nó.
Để kết luận chúng tôi xin đưa ra một đặc trưng nổi bật của phát triển toán học bắt đầu từ thời kỳ phục hưng trong lời nói đầu của cuốn sách R. Courout và G. Robin. [28] “Sau thời kỳ tích luỹ lực lượng một cách chậm chạp – vào thế kỷ 17 cùng với sự ra đời của hình học giải tích và phép tính vi tích phân – đã mở ra một thời kỳ cách mạng như vũ bão trong phát triển của toán học và vật lý. Trong những thế kỷ XVII và XVIII, tư tưởng của người Hy Lạp về sự kết tinh theo tiên đề và sự suy diễn một cách có hệ thống đã mờ dần và mất ảnh hưởng của nó dù rằng hình học cổ đại vẫn tiếp tục có những bông hoa nở rộ. Tư tưởng tuyệt vời về logic xuất phát từ những định nghĩa rõ nét và những tiên đề “hiển nhiên” không mâu thuẫn gì nhau đã ngừng nhập cảng vào những người khai phá mới những tri thức toán học. Ham mê cuộc say sưa chân chính với những thông đoán trực quan, chuyển dịch những kết luận bất khả xâm phạm với những lời khẳng định nửa huyền bí và vô nghĩa, tin tưởng mù quáng vào lực lượng siêu nhân của các thủ tục hình thức, họ đã khám phá được một thế giới toán học mới vô cùng phong phú. Nhưng rồi ít một, trạng thái nhập định của tư tưởng bị ham mê bởi những thành tựu làm chóng mặt đã nhường chỗ cho tinh thần nhẫn nại và phê phán. Trong thế kỷ XIX, ý thức về sự cần thiết phải củng cố khoa học, nhất là trong mối liên hệ với những yêu cầu của nền giáo dục cao đẳng phổ biến rộng sau cách mạng Pháp đã dẫn đến việc xét lại những cơ sở của môn toán học mới, nói riêng, sự chú ý đã hướng về các phép tính vi tích phân và tích phân nhằm làm sáng tỏ khái niệm giới hạn đã ngầm hiểu trong giải tích. Như vậy thế kỷ XIX không những chỉ là một thời đại của các thành tựu mới mà còn là thời đại chứng kiến sự hoàn lại tính chính xác và độ chặt chẽ của các phép chứng minh lý tưởng
học hiện nay mà tôi rất ngưỡng mộ thì độ chính xác sẽ không cho phép được đẩy mạnh lên” L.J.Mandeishtam đã nói như vậy. [42, tr. 51] Phụ hoạ thêm là lời phát biểu của Kapys.P.L [40, tr. 30] : “Tư duy logic sắc bén, thuộc tính của các nhà toán học, khi tiền đề hoá những cơ sở mới thì lập tức gây nên phiền toái vì nó đã làm te liệt óc tưởng tượng”.
13Và thậm chí đã có một ngôn ngữ riêng, trong đó các thuật ngữ “Sự hội tụ thực tiễn”, “chất lượng của phương pháp tính”, “chất lượng của mô hình toán học”, ...
14V.V.Novozhilov [44] viết : Hiện nay ngày càng thấy rõ khuynh hướng phân công lao động: Có những nhà bác học đang hoàn thiện toán học theo hướng logic phát triển nội tại của nó, có các nhà khoa học khác lại nghiên cứu các phương pháp toán học và được áp dụng một cách mau chóng. Những đại biểu của hai phương hướng này rõ ràng khác nhau không những chỉ ở nhóm các vấn đề “của họ” mà còn ở tư chất của tư duy.
Nhà toán học lý thuyết tìm mọi cách lập luận một cách chặt chẽ nhất cho mỗi một hành động và luôn luôn bó tròn trong khuôn khổ khoa học của mình trong khi các nhà toán học ứng dụng lại dùng các phương pháp mà tính chặt chẽ và độ sai còn chưa được đánh giá. Khả năng tránh sai sót của anh ta là dựa vào kinh nghiệm, so sánh các két quả tính toán với thực nghiệm. Anh ta cần làm như vậy vì đại bộ phận các bài toán hiện nay trong vật lý và kỹ thuật đều không được giải quyết một cách chặt chẽ. Về những bài toán học đa dạng nảy sinh trong công tác thực tiễn của người kỹ sư hiện nay, cũng như về đặc điểm của các phương pháp toán học tương ứng có được nói đến trong tuyển tập [45], nói riêng xin lưu ý những bài báo có tính chất tổng hợp của N.F.Garasjuta. Ju.A.Mitropolski và A.V.Skorokhod. Về mối tương quan giữa toán học và kỹ thuật, xem thêm [46]. Về mối tương quan giữa toán học và vật lý hiện nay, xem thêm [47-49]. Về triển vọng phát triển của toán học, xem thêm [50].
47
Tạp chí Epsilon, Số 06, 12/2015
cổ điển. Về mặt này thì hình ảnh Hy Lạp quả là có trội hẳn lên. Lại một lần nữa con lắc lại đưa về phía tính tuyệt vời logic và tính trừu tượng. Có lẽ hiện nay chúng ta chưa bước ra khỏi thời kỳ đó dù rằng được phép hy vọng là sự gián đoạn đáng tiếc giữa toán học thuần tuý và những ứng dụng sinh động của nó sẽ được thay thế bởi một kỷ nguyên hợp nhất chặt chẽ hơn. Phần dự trữ đã có của các lực lượng bên trong và cùng với sự cực kỳ giản lược khác đạt được trên cơ sở những quan niệm rõ ràng cho phép ngày nay nghiên cứu được lý thuyết toán học mà không tách rời khỏi những ứng dụng. Xác lập một lần nữa mối liên hệ hữu cơ giữa tri thức thuần tuý và tri thức ứng dụng, sự cân bằng lành mạnh giữa tính tổng quát trừu tượng và tính cụ thể sinh động – đó là điều chúng tôi thấy ở nhiệm vụ của toán học trong một tương lai không xa”. 15
Trong toán học gồm có những gì?
Toán học ứng dụng là cái gì? và nói chung nó có tồn tại hay không? Những vấn đề này đã đến lúc cần phải thảo luận một cách triệt để. Đáng chú ý là thuật ngữ “toán học ứng dụng” hiện nay đã trở thành một thuật ngữ rất mốt (nhất là ở những người không phải chuyên gia).
Có lẽ quan điểm phổ biến nhất đối với khái niệm “toán học ứng dung” trong hàng ngũ các nhà toán học là quan điểm cho rằng nói chung không có toán học ứng dụng. Ngoài ra, các nhà toán học khác nhau lại cho những từ này một nội dung hoàn toàn khác tuỳ theo các nhà toán học ấy có gia nhập vào bản thân môn toán học hay không. 16
Có những người cho rằng chỉ những kết cấu thuần tuý suy diễn mới được gọi là toán học. Tất cả những gì nằm ngoài kết cấu đó, không có quan hệ với toán học hoặc những bộ môn của toán học thì cũng không được gọi là toán học. 17 Hiện nay quan điểm này ít được phát biểu ầm ĩ song một cách “không chính thức” nó vẫn còn khá phổ biến, bên cạnh những việc khác, quan điểm này tỏ ra “thuận tiện” cho nhiều người dạy toán với những người không phải các nhà toán học.
Thực tế quan điểm này đã thu hẹp một cách vô lý và đáng kể ranh giới của Khoa học Toán học vĩ đại và trước hết mang lại cái bất lợi cho chính môn Toán học (và tất nhiên cho chính sự nghiệp đào tạo các nhà bác học trẻ). Về vấn đề này M. Las và S. Ulam đã viết : “Những cố gắng – tiếc rằng lại khá phổ biến – nhằm tách rời toán học “thuần tuý” khỏi toàn bộ phần hoạt động khoa học còn lại và nhằm chắt nó lại để nấu thành một loại nước cốt đặc biệt chỉ làm nghèo nàn cả toán học lẫn các môn khoa học khác”. [13, tr. 234].
F. Klein cũng đã phát biểu một tư tưởng như vậy : “Những quan niệm logic thuần tuý phải tạo ra, như người ta vẫn nói, một bộ xương rắn chắc của cơ thể toán học, đảm bảo cho nó độ ổn định
15A.N.Kolmorokov đã có nói rằng ước mơ mà ông theo đuổi từ lâu là thanh toán phân cách giữa những phương pháp “chặt chẽ” của các nhà toán học thuần tuý và những biện pháp “không chặt chẽ” của những lập luận toán học của các nhà toán học ứng dụng, các nhà vật lý và các kỹ thuật (dẫn theo [51]).
16Khi liệt kê các quan điểm ở các phần 6 và 7 nói riêng đã dùng những ý kiến nói miệng của M.A.Krasnoselski. 17Đây là một câu nói cực đoan nhất của lập trường này “Toán học là sự xây dựng một lý trí thuần tuý và vì vậy nó không cần các mối liên hệ với những lĩnh vực hoạt động khác của con người” (L.Mordell [52, tr. 28]). Xin dẫn thêm lời phát biểu của J.Diendonne về vấn đề này (dẫn theo [53, tr. 18]) : “... về nguyên tắc, trong cơ sở toán học hiện đại không có một mục đích hữu dụng nào và là một bộ môn trí lực mà lợi ích thực tiễn quy về số khôn, nhà toán học trong các công trình nghiên cứu của mình không hề vương vấn tư tưởng về mức hữu ích của các kết quả đạt được trong tương lai (hơn nữa điều đó cũng không thể thấy trước được) mà chỉ theo đuổi ước muốn hiểu được hiện tượng toán học, một hiện tượng tự kết thúc ở chính nó, toán học không hơn gì sự “xa xỉ” mà một nền văn minh có thể tự cho phép mình”. Rất tiếc rằng điều đó lại được nói ra ở một người, một trong những người lãnh đạo nhóm “Bourbaki” và có ảnh hưởng đáng kể đến bộ mặt của toàn bộ toán học hiện đại.
48
Tạp chí Epsilon, Số 06, 12/2015
và đáng tin cậy. Nhưng bản thân cuộc sống của toán học, những quy nạp quan trọng nhất và tính tích cực của nó lại là chủ yếu liên hệ với những ứng dụng của nó, tức là với mỗi tương quan giữa những khách thể trừu tượng với toàn bộ các lĩnh vực khác. Loại trừ những ứng dụng khỏi toán học chẳng khác gì đi tìm một thực thể sống chỉ từ một hài cốt, không bắp thịt, không thần kinh, không mạch máu”. [29, tr.46].
Cuối cùng chúng tôi xin dẫn lời của A. Poincaré: “Vật lý học không nhũng chỉ cho chúng ta (các nhà toán học – tác giả) cái lý để giải quyết vấn đề, nó còn giúp chúng ta tìm thấy các phương tiện để giải quyết vấn đề nữa. Điều này xảy ra theo hai con đường. Một là nó cho ta linh cảm của phép giải, hai là gợi ý cho ta tiến trình của các lập luận”. [54, tr.108].
Thực chất ở đây đã biểu thị một quan điểm thứ hai mà chúng tôi cho rằng dễ dàng chấp nhận được hơn, quan điểm đó cho rằng gia nhập vào lĩnh vực hoạt động của toán học còn có cả các phương pháp giải thực tiễn đối với các bài toán bắt nguồn từ bên ngoài toán học.
Song chúng ta còn phấn khởi hơn với một quan điểm thứ ba, rộng nhất, cho rằng toán học không những chỉ bao hàm các lĩnh vực suy diễn mà còn bao hàm toàn bộ những thực chất toán học – các khách thể toán học, các phương pháp và tư tưởng gặp trong toán học lý thuyết cũng như trong các ứng dụng : tức là kết cấu các mô hình toán học, thực nghiệm toán học, những lập luận quy nạp hay những lập luận hợp lý khác có tính chất toán học, ...
Trong cuốn sách rất hay của G. Polya [56, tr.309] có nói rằng : “Giới hạn của toán học là miền những lập luận chứng minh thuộc bất kỳ khoa học nào đã đạt mức phát triển là những khái niệm thuộc khoa học ấy có thể biểu thị được dưới dạng logic toán trừu tượng”. Chúng tôi muốn thêm vào ở đây là trong khái niệm chứng minh không nên gắn cho nó một nội dung giáo điều, hẹp hòi.
Tất nhiên những môn sinh của quan niệm này, một quan niệm mà chúng tôi cho rằng tiến bộ và chín muồi hơn cả đối với toán học (và điều đó cũng khá cơ bản đối với các nhà toán học) phải khước từ “tính thống nhất lý thuyết tập hợp” của toán học mà chỉ coi nó như một “hạt nhân” nào đó của toán học mà thôi.
Các quan điểm về toán học ứng dụng
Trước hết chúng tôi lấy làm buồn rầu mà lưu ý rằng theo ý kiến của một số nhà toán học thì nghiên cứu những ứng dụng nói chung là một điều hổ thẹn.
Về vấn đề này F. Klein đã viết : “Rất tiếc rằng ... vẫn còn gặp những giáo viên đại học đã không che dấu những lời lẽ quá ngạo mạn đối với những người làm về ứng dụng. Cần phải đấu tranh quyết liệt nhất với cái tính kiêu căng thể hiện trong những quan điểm đó. Mọi thành tựu xác đáng, cho dù nó thuộc lĩnh vực lý thuyết hay ứng dụng, đều phải được đánh giá cao như nhau vì nó tạo cho mỗi người khả năng nghiên cứu những vật mà mình cảm thấy gần gũi hơn cả. Khi đó mỗi người sẽ biểu hiện đa dạng hơn số lớn những tài năng mình có : vì những thiên tài vĩ đại như Aschimede, Newton, Gauss là những người luôn luôn chiếm lĩnh cả lý thuyết lẫn thực tiễn như nhau”. [57, tr.314].
Xin dẫn thêm lời của R. Courant : “Thực ra giữa toán học “thuần tuý” và toán học “ứng dụng” không thể vạch ra một ranh giới rõ rệt được. Vì vậy trong toán học không thể phân ra một lớp người thầy tứ tối cao thiên về cái vẻ đẹp hoàn thiện của toán học và chỉ chú ý đến thiên hướng đó
49
Tạp chí Epsilon, Số 06, 12/2015
của mình, và những người phục vụ cho họ. Sự “phân đẳng cấp” đó trong trường hợp tốt nhất cũng chỉ là một triệu chứng của những bộ óc hẹp hòi”. [12, tr.27]. N.Bailey cũng nói về sự bất lợi của sự đua đòi ấy trong cuốn sách hữu ích của ông [58, tr.138] khi nói về những ứng dụng của toán học trong vào sinh vật và y học.
V.V. Novozbilov viết : “Tiếc rằng nhà lý thuyết cho đến nay vẫn thường coi “nhà ứng dụng” như một nhà toán học loại hai, một nhà khoa học không có khả năng làm việc một cách thật chặt chẽ và lấy cái riêng làm tổn thất cái chung. Dễ dàng phát hiện ở các “nhà ứng dụng” những sai sót trong lập luận xét về tính chặt chẽ, nhà lý thuyết thường tỏ ra thờ ơ với những thành tựu của họ - đó là việc họ biết cách giải những bài toán thực tại với một số chính xác đủ dùng cho những mục đích thực tiễn mà bản thân nhà lý thuyết không thể giải được bằng các phương pháp chặt chẽ”. [44]
Qua những câu trích dẫn trên ta thấy khá nổi bật khía cạnh tâm lý của vấn đề. Nhưng độc lập với điều đó tưởng cần phải nhấn mạnh rằng hiện nay người ta ngày càng thừa nhận sự tồn tại khách quan của toán học ứng dụng. Song đằng sau sự thừa nhận đó còn nhiều quan điểm khác nhau.
Ví dụ một số người cho rằng toán học ứng dụng là một bộ phận toán học “thường dùng hằng ngày” với nghĩa xấu của từ đó, tồn tại dưới dạng một số các biện pháp, các đơn thuốc và quy tắc thiếu chặt chẽ và không hoàn thiện về mặt logic (có thể là do trình độ toán học còn thấp của các chuyên gia trong lĩnh vực này). Những thiếu sót đó của toán học ứng dụng có thể khắc phục được và kết quả sẽ là cái “toán học khuyết” đó sẽ được nâng lên mức toán học tiêu chuẩn. 18
Chúng tôi cho rằng quan điểm ngây thơ nhưng phổ biến này, nếu như nó không phải một biểu hiện của sự đua đòi thì cũng là dựa trên một cơ sở không nhận thức được tình hình đúng đắn của vấn đề. Thực ra theo quan điểm này thì làm thế nào có thể giải thích được một sự việc là các nhà vật lý, các kỹ sư nghiên cứu lý thuyết và các chuyên gia khác trong đó rõ ràng có không ít những người khá thông minh khi áp dụng toán học đã cố tình né tránh ngôn ngữ suy diễn chặt chẽ? Và mặc dầu ở các học viện họ đã được học ngôn ngữ đó một cách có hệ thống song họ vẫn muốn (liệu có hại chăng?) được học lại khi chuyển sang ngôn ngữ của toán học ứng dụng và xây dựng lại toàn bộ phong cách tư duy suy diễn thuần tuý đòi hỏi nhất thiết phải có. Chúng tôi nghĩ rằng sự xây dựng lại đó hoàn toàn là tự nhiên và điều giải thích duy nhất cho nó là: Sự xây dựng lại đó là cần thiết. Dưới đây chúng tôi sẽ cố gắng chứng minh rằng sự vắng mặt yêu cầu nhất thiết phải có về sự hoàn thiện logic hình thức trong những ứng dụng của toán học là điều không thể tránh được, và đó không phải là một dấu hiệu của sự thua kém mà là một nguồn sức mạnh đặc biệt của toán học ứng dụng.
Một quan niệm khác đã đồng nhất toán học ứng dụng với toán học tính toán và toán học máy tính. Đây là một quan điểm hẹp hòi và có xu hướng phiến diện.
Bây giờ chúng tôi xin đề cập đến một quan điểm đã được phát biểu trong một bài báo của chúng tôi [2]. Xuất phát điểm của chúng tôi là cho rằng phép giải toán học những bài toán ứng dụng có
18Đôi khi quan điểm này thể hiện sự phản đối những công trình, và tuyệt nhiên, không phải là hiếm, trong đó sự nông nỗi về toán học đã dẫn tới nhưng sai lầm trực tiếp (mà dưới đây chúng tôi sẽ nói một cách chi tiết) hoặc còn tồi hơn, những công trình trong đó sự kém cỏi về toán học đã được “đền bù” bằng cách dẫn ra các ý nghĩa thực dụng của các kết quả. Tiếc rằng quan điểm này đôi khi cũng có ở ý thức những nhà ứng dụng khi họ dùng một tổng thể nào đó không còn có giá trị đầy đủ. Điều này lại dẫn đến những động tác có vẻ khoa học rất lố lăng mà thường còn là trào phúng nữa.
50
Tạp chí Epsilon, Số 06, 12/2015
những nét đặc thù của nó. Ở đây, trước hết về mặt nguyên tắc thì không thể tiến hành phép chứng minh ở mức các công trình nghiên cứu toán học thuần tuý ít ra bởi vì mô hình toán học của một khách thể thực tại chỉ có thể mô tả những nét cơ bản theo nghĩa này hay khác của khách thể ấy chứ không khi nào có ý định và không thể có ý định mô tả nó một cách đầy đủ. Mặt khác trong việc giải những bài toán thực tiễn thì trước hết có những yêu cầu mà trong nghiên cứu toán học thuần tuý chỉ được coi là những yêu cầu thứ cấp: Bởi vì một bài toán ứng dụng phải được giải không những đúng mà còn phải kịp thời, tiết kiệm sức lực, nghiệm phải chấp nhận được đối với các phương tiện tính toán hiện có và phải thuận tiện trong sử dụng thực tiễn và phải có độ chính xác thích hợp với bài toán, ... 19
Chúng tôi quy định gọi việc thực hiện tốt nhất tất cả những yêu cầu đó mà đôi khi còn mâu thuẫn nhau nữa là tính tối ưu của nghiệm (đối với những ứng dụng) dù phải lưu ý trước rằng trong giai đoạn phát triển hiện nay của khoa học thì khó mà chỉ ra được một chức năng duy nhất về mục đích. Xuất phát từ điều đó đã đề nghị một định nghĩa là: Toán học ứng dụng là khoa học về các phương pháp giải tối ưu, mà về thực tiễn là chấp nhận được, những bài toán học nảy sinh từ bên ngoài toán học. Như vậy, toán học ứng dụng là toán học bị gián tiếp bởi thực tiễn, một bộ phận khoa học hợp thành tựa như sinh hoá hay nhiệt kỹ thuật. Sự phát triển của bộ môn này được xác định bởi sự mở rộng nhóm những ứng dụng cũng như bởi sự thay đổi nội dung cụ thể của khái niệm tính tối ưu của phép giải bài toán, nói riêng, nội dung này hoàn toàn thay đổi do ảnh hưởng của các phương tiện tính toán hiện nay. Tất nhiên nếu chúng ta tìm thấy nghiệm tối ưu thì điều đó không có nghĩa là ta loại bỏ những nghiệm chỉ đáp ứng gần đúng yêu cầu của tính tối ưu. Phần lớn các nghiệm thực tại mà chúng ta dùng thì cũng là những nghiệm mà trong một thời gian nào đó, ở một mức độ nào đó đã thoả mãn yêu cầu đó.
Về vấn đề này ta có thể nhớ đến một câu cách ngôn nổi tiếng : “Toán học thuần tuý làm cái có thể khi cần còn toán ứng dụng làm cái cần khi có thể ”. 20 Câu cách ngôn đó truyền đi một xu hướng nói chung là đúng, dù rằng từ “cần” được dùng ở đây theo những nghĩa khác nhau. Chỉ để ý đến ý nghĩa thứ hai, dưới đây chúng tôi sẽ cố gắng chứng minh rằng toán học ứng dụng làm cái cần khi cần làm.
Cũng đáng chú ý đến một quan điểm được L.V. Ovsjannikov phát biểu bằng lời: “Toán học ứng dụng là khoa học về các mô hình toán học, chi tiết hơn, có thể nói rằng, là khoa học về các kết cấu, nghiên cứu, diễn tả và tối ưu hoá các mô hình toán học. Định nghĩa này nhằm vào đối tượng của khoa học đó và theo chúng tôi thì không mâu thuẫn gì với định nghĩa trên là định nghĩa nặng về tính chất chức năng hơn. Như vậy, nếu muốn so sánh tương tự - nói chung cũng khá xa – giữa toán học và ngôn ngữ thì toán học thuần tuý và toán học ứng dụng có thể sẽ làm người ta lần lượt nhớ đến văn phạm và ngữ nghĩa”.
Bàn về vấn đề toán học ứng dụng có tạo thành một khoa học độc lập không là việc làm có chút ít kinh nghiệm vì do tính nhiều nghĩa của cách nói “khoa học độc lập” thì đúng đắn hơn có thể
19Với tinh thần này, I.Babuska, E.Vitasek và M.Phager đã viết trong một cuốn sách rất hay [59, tr.9] : “... ngày nay, một bài toán chỉ được coi là đã giải được khi có một phương pháp hiệu lực cho một kết quả cần thiết với một độ chính xác dủ dùng trong một khoảng thời gian nhất định”. Trong cuốn sách của N.S.Bakhvalov [60, tr.14] được viết với một quan niệm sâu sắc về những tình huống ứng dụng thực tại đã có nói rằng: “Tìm thấy một nghiệm thoả mãn bài toán mà kịp thời thì tốt hơn là có được nghiệm đầy đủ của bài toán đó vào lúc nó đã mất ý nghĩa”.
20Về điểm này xin dẫn lời của J. Dixon: “Nếu những phương pháp đầy sức mạnh của toán học không cho phép thu được kết quả đôi khi đã xảy ra thì cần phải tiếp tục tìm tòi. Nên nhớ rằng khi phân tích về kỹ thuật thì cần có được một kết quả bằng số bằng bất kỳ phương pháp nào. [20, tr. 78].
51
Tạp chí Epsilon, Số 06, 12/2015
không nên nói về một khoa học mà là về một khía cạnh của toán học ra đời trong những ứng dụng của nó, và nếu có thể, thì nên nói về kết quả của phép “chiếu” toán học một cách độc đáo lên nền văn minh, điều quan trọng là với phép chiếu đó thì toán học có những nét mới về chất và phép chiếu ấy, những nét ấy cũng sẽ định nghĩa cho toán học ứng dụng.
Do đó chúng tôi sẽ dùng các từ toán học ứng dụng coi như một thuật ngữ làm việc được xác định bởi quan điểm cuối cùng nêu ở trên và dành vấn đề về tính độc lập của sự tồn tại toán học ứng dụng với tính cách một khoa học cho các nhà triết học. 21 Để phân biệt với điều đó, khi nói về toán học thuần tuý, chúng tôi trước hết sẽ quan niệm rằng đó là toán học chính thống từ Weierstrass đến Bourbaki dựa trên cơ sở lý thuyết tập hợp ngây thơ. 22
Chúng tôi chủ yếu chú ý đến những vấn đề cụ thể hơn : đó là những nét đặc trưng nảy sinh trong ứng dụng của toán học, đặc điểm của phương pháp lập luận của toán học ứng dụng và nói riêng là những lập luận nào được thừa nhận là đã được chứng minh trong toán học ứng dụng đó, ... Việc thảo luận những vấn đề này có thể là hữu ích, thậm chí khá sôi sôi nổi trong cả các công trình hoàn toàn có tính chất cụ thể.
Để kết luận, chúng tôi đưa ra những lời nói sáng sủa R. Courant nói về sự khác nhau trong phương pháp tiếp cận các vấn đề của toán học thuần tuý và toán học ứng dụng và cũng dùng làm phần giới thiệu độc đáo cho phần trình bày tiếp sau của chúng tôi.
“Cùng một vấn đề toán học có thể được giải quyết khác nhau, người theo quan niệm toán học chặt chẽ (và khuynh hướng này đôi khi còn thấy ở mọi người nghiên về tư duy khoa học) thì đòi hỏi một sự hoàn thiện không nhân nhượng. Anh ta không cho phép có những lỗ hỗng trong logic của tư duy và trong cách giải các bài toán được đặt ra, và kết quả đạt được theo ý anh ta phải là một đỉnh cao của một mắt xích liên tục những lập luận toàn thiện. Và nếu như đối phương của quan điểm này mà gặp những khó khăn dường như không khắc phục nổi thì anh ta sẽ mau chóng tìm cách phát biểu lại bài toán hoặc thạm chí đặt nó khác đi nhưng cùng loại với bài toán cũ, trong đó có thể khắc phục được những khó khăn (“cái có thể khi cần” – tác giả). Còn có một con đường vòng khác nữa, xác định lại xem cái gì được coi là “nghiệm của bài toán”. Trong thực tế, cách làm này đôi khi là một bước sơ bộ khá được chấp nhận để đi tới nghiệm chân chính của bài toán ban đầu.
Trong các công trình nghiên cứu có tính chất ứng dụng thì mọi thứ đều khác. Trước hết không thể dễ dàng làm thay đổi hoặc lảng tránh bài toán đã được đặt ra. Ở đây đòi hỏi một cái khác là đưa ra một câu trả lời đúng đắn và đáng tin cậy theo quan điểm chung của người ta. Trong trường hợp cần thiết, nhà toán học có thể có nhân nhượng: Anh ta phải sẵn sàng đưa những dự đoán vào
21Về điểm này còn có một khó khăn phụ nữa là những khái niệm “nghiên cứu ứng dụng”, “chương ứng dụng”, ... chỉ là tương đối, điều đó đôi khi dẫn đến sự hiểu lầm khác nhau. Ví dụ dẫn đến chỗ có những người không hề là như vậy những cũng gọi nhau là những nhà ứng dụng (và tương ứng là những nhà lý thuyết). Có nhiều những công trình nghiên cứu các cuốn sách có thể gọi được là ứng dụng (nếu chúng được xem xét theo những lập trường trừu tượng hơn) cũng như gọi được là toán học thuần tuý (giả sử theo lập trường của một kỹ sư). Tất nhiên tính tương đối của khái niệm “ứng dụng” cũng có trong vật lý, cơ học và các bộ môn khoa học khác. Về khái niệm và triển vọng phát triển của toán học ứng dụng xem thêm [61-72].
22Cần nhấn mạnh rằng việc tách ra toán học thuần tuý và toán học ứng dụng là không có tính chất tuyệt đối vì thực chất đó là những khía cạnh khác nhau của một khoa học vẫn giữ nguyên các nét quan trọng về sự thống nhất (trước hết chủ yếu ở đối tượng nghiên cứu là các cáu trức, nhưng cũng không phải cũng chỉ có vậy). Trong mỗi một khía cạnh này lại nảy sinh những tư tưởng sâu sắc tác động lẫn nhau một cách tích cực (vì vậy, nói toán học “thuần tuý” là không đạt mà nên nói toán học “lý thuyết”). Song sự tương tác dó còn lâu mới tối ưu được.
52
Tạp chí Epsilon, Số 06, 12/2015
xích các lập luận cũng như cho phép một sai số nhất định trong những giá trị bằng số. Những ngay cả những bài toán chủ yếu theo phương hướng thực tiễn, ví dụ bài toán về các dòng có sóng va chạm, cũng có thể đòi hỏi một công trình nghiên cứu toán học cơ bản để xác định xem bài toán đó được đặt ra có đúng hay không. Trong các công trình nghiên cứu ứng dụng có thể đòi hỏi cả những phép chứng minh những định lý toán học thuần tuý về sự tồn tại bởi vì sự tin tưởng là có nghiệm có thể đảm bảo cho độ tin cậy của mô hình toán học được sử dụng, (thực ra điều này có phức tạp hơn đôi chút và về sau chúng tôi sẽ nói lại vấn đề này – tác giả). Và cuối cùng, chế ngự trong toán học ứng dụng là các phép xấp xỉ vì thiếu chúng thì không thể chuyển được các quá trình vật lý thực tại thành các mô hình toán học.
Việc quay lại với hiện thực đã được biến đổi thành các mô hình toán học trừu tượng và sự đánh giá những sự tương ứng đã đạt được ở đây đòi hỏi phải có những thói quen trực quan hoàn thiện qua kinh nghiệm. Thường cần phải biến đổi như thế nào đó đối với bài toán học lúc đầu tỏ ra rất phức tạp để có thể giải được bằng các phương pháp hiện đại. Điều này phần nào giải thích được tính chất rủi ro về trí óc và sự thoả mãn có ở các nhà toán học làm việc với các kỹ sư và các nhà khoa học tự nhiên để giải các bài toán hiện thực có ở khắp nơi, tại đó con người tìm cách nhận thức thiên nhiên và điều khiển nó”.
53
Tạp chí Epsilon, Số 06, 12/2015
54
CUỘC ĐỜI VÀ SỰ NGHIỆP CỦA GEORGE BOOLE SỰ KHỞI ĐẦU CHO KỶ NGUYÊN KỸ THUẬT SỐ
Desmond MacHale
(Dịch giả: Hoàng Cao Phong, Hà Nội)
Đại học Cork hiện đang kỷ niệm 200 năm ngày sinh nhà toán học và logic học George Boole. Từ tháng 10 năm 2015; Đại học Cork đã lên kế hoạch cho một loạt các sự kiện trong năm dành cho George Boole 1. Sức ảnh hưởng trong những công trình của Boole đang ngày càng trở nên mãnh liệt trong vài thập niên trở lại đây, từ khoa học máy tính cho đến công nghệ kỹ thuật số.
Cuốn tiểu sử mới của Boole viết bởi Desmond MacHale vừa được xuất bản bởi Nhà xuất bản Đại học Cork. Đây là bản chỉnh sửa của phiên bản năm 1985 xuất bản bởi Nhà xuất bản Boole. Lời tựa của phiên bản trước được viết bởi nhà toán – vật lý học nổi tiếng người Ai-len - John L. Synge. Lần này, cuốn sách có một lời tựa mới được viết bởi Ian Stewart của Đại học Warwick. Ấn bản đầu tiên này đã được biên tập bởi Ivor Grattan-Guinness 2.
Đây là một cuốn tiểu sử rất toàn diện, đóng góp vô cùng to lớn cho sự hiểu biết của chúng ta về một nhà toán học và logic học có tầm ảnh hưởng lớn của thế kỉ XIX. Nó khắc họa một cách đầy đủ bức chân dung của Boole, không chỉ là một con người của khoa học mà còn là một nhà cải cách xã hội, nhà tư tưởng tôn giáo và một người đàn ông của gia đình. Ông cũng là một triết gia tinh túy. Cuốn sách là kết quả của những nghiên cứu và tìm hiểu kĩ lưỡng, công phu, kể lại những câu chuyện về cuộc sống và sự nghiệp của Boole một cách có hệ thống với sự cuốn hút bền bỉ.
1. Thuở thiếu thời
George là con cả trong một gia đình có 4 con, ông là một thanh niên nhút nhát nhưng đặc biệt thông minh. Từ thời niên thiếu, ông đã có thể sử dụng thành thạo tiếng Latin và tiếng Hy Lạp, ngoài ra ông còn tự học tiếng Pháp, tiếng Đức và tiếng Ý. Điều này đã giúp ông sau này có thể dễ
1http://www.georgeboole.com
2Vol. 14, Sept. 1985, http://www.maths.tcd.ie/pub/ims/nl14
55
Tạp chí Epsilon, Số 06, 12/2015
dàng tiếp cận với sự phát triển của nền toán học trên toàn châu lục, cho phép ông tiến xa hơn hầu hết những đồng nghiệp của mình. Ông đã học qua lớp tiểu học, nhưng do quá nghèo nên không thể tiếp tục bậc trung học; chính vì vậy, ông phải tự học những kiến thức toán cao cấp bằng cách nghiên cứu các tác phẩm của những nhà toán học hàng đầu thời gian đó.
Boole bắt đầu nghiên cứu toán học một cách thực sự nghiệm túc khi ông khoảng 16 tuổi. Sau khi thành thạo giải tích, ông nghiên cứu sang các tác phẩm của Newton, Lagrange, Laplace, Jacobi và Poisson. Như là một người tự học, Boole đã tạo ra một phương pháp độc lập khi tiếp cận những vấn đề nghiên cứu. Cảm hứng ban đầu của ông với toán học đến từ ứng dụng của nó nhằm giải quyết những vấn đề khoa học khác, nhưng dần dần, ông bị quyến rũ bởi vẻ đẹp và sự thú vị của toán học thuần túy. Ông đã công bố một số công trình về phương trình vi phân, tích phân, logic, xác suất, hình học và đại số tuyến tính.
Năm 1841, cuốn sách “Lý thuyết tổng quát về phép biến đổi tuyến tính” của Boole đặt nền móng cho sự phát triển của một ngành toán học mới - lý thuyết bất biến. Cayley và Sylvester là những người đã phát triển lý thuyết bất biến lên một tầm cao mới, nhưng cả hai đều thừa nhận Boole đã khơi nguồn cảm hứng cho những nỗ lực của họ.
Tài liệu “Về một phương pháp tổng quát của giải tích” của ông đã được xuất bản vào năm 1844 trong tuyển tập các công trình triết học của Hội Hoàng gia. Cũng nhờ vậy, ông đã giành được Huy chương vàng của Hội, giải thưởng đầu tiên như vậy trong lĩnh vực toán học. Bài báo giới thiệu một phương pháp tổng quát hóa cách giải quyết một lớp lớn những phương trình vi phân và sai phân với hệ số thay đổi.
2. Đại học Cork Queen
Tháng 10 năm 1846; Boole ứng tuyển cho vị trí giáo sư toán học tại một trong ba trường đại học Queen: Ở Belfast, Galway và Cork. Đơn xin xét tuyển của Boole làm hội động hết sức sửng sốt bởi ông tuyên bố: “Tôi không phải là thành viên của bất kỳ trường đại học nào và chưa từng học tại một trường đại học nào”. Tuy vậy, đơn của ông nhận được sự ủng hộ rất mạnh mẽ từ các nhà toán học hàng đầu. Sau thời gian trì hoãn, ông được giao phó một vị trí trong Đại học Cork và làm việc ở đó vào tháng 10 năm 1849 với mức lương khởi điểm 250 bảng Anh một năm.
Các đại học Queen đều là những cơ sở đa giáo phái, và do vậy đã gây nên những cuộc tranh cãi từ đầu khi bị hệ thống Công giáo mô tả như là những trường đại học vô thần. Trong một thời gian, Boole cố gắng tránh tham gia trực tiếp vào các cuộc xung đột tôn giáo, tuy nhiên ông không thể không bị ảnh hưởng. Mặc dù bản chất hòa nhã, ông cũng đã dính vào một loạt các cuộc tranh luận gay gắt ở trường đại học. Có lẽ nhiều thông tin chi tiết được cung cấp bởi MacHale hơn là thực sự cần thiết, từ những lá thư dài đến các tờ báo trích dẫn.
Trong những năm đầu ở Cork, Boole rất cô đơn và dường như không mấy hạnh phúc. Tuy nhiên, mọi thứ đã hoàn toàn thay đổi vào năm 1855 khi ông kết hôn với Mary Everest 23 tuổi lúc ở tuổi 40: Mary là cháu gái của vị giáo sư người Hy Lạp tại Đại học Queen và đồng thời là cháu gái của George Everest, nhà tổng trắc địa học của Ấn Độ, cũng là người đã được đặt tên cho ngọn núi cao nhất thế giới. Một cách ngắn gọn, cuộc hôn nhân rất hạnh phúc và họ đã có năm người con gái, cả năm đều tài giỏi hơn người theo một cách nào đó.
56
Tạp chí Epsilon, Số 06, 12/2015
3. Các định luật của tư duy
Năm 1833; khi mới 18 tuổi, Boole đã có một ý tưởng thoáng qua rằng tất cả những quan hệ logic đều có thể biểu diễn dưới dạng các công thức. Chính ý tưởng này sau đó đã trở thành cống hiến to lớn của ông đối với ngành khoa học: Giải thích cho quá trình suy nghĩ của con người bằng những ngôn ngữ toán học chính xác. Những nỗ lực để biến logic thành một bộ môn khoa học khởi nguồn từ Aristotle, và Leibniz đã đặt những bước đầu tiên trên con đường thể hiện mối quan hệ logic dưới dạng mặc dù ông chưa tìm ra một ký hiệu phù hợp. Năm 1847; Boole viết cuốn sách “Phân tích về Logic học”, được miêu tả với tựa đề là “Phép tính cho các lập luận hợp lý”. Cuốn sách này đánh dấu cho sự khởi đầu của logic hình thức.
Tác phẩm lớn nhất của Boole, “Các định luật của tư tưởng”, đã được viết trong suốt thời gian ông ở Đại học Queen. Một trong những nhận xét sâu sắc nhất của ông chính là toán học không hề giới hạn bởi con số hay số lượng, mà mang một ý nghĩa lớn hơn về cách biểu diễn vạn vật dưới dạng thức phù hợp với một số quy tắc nhất định. Mục tiêu của ông là chuyển hóa các mệnh đề logic thành dạng công thức và từ đó, những kết luận logic trở thành kết quả của những phép toán với các giả định ban đầu. Việc xem xét các lớp thay vì chỉ tập trung vào những con số đã mở đường cho lý thuyết tập hợp, hiện là tâm điểm của nền tảng toán học.
Boole là người đầu tiên dùng các phép toán đại số để biểu diễn thay cho các mệnh đề logic, từ đó tạo ra một động lực mạnh mẽ cho lĩnh vực logic hình thức. Trước đây, không có ai đánh giá cao bản chất toán học xuất hiện trong ngôn ngữ hàng ngày. Ngành đại số học phát triển bởi Boole hiện nay đã trở thành công cụ lý tưởng trong việc xử lý thông tin và hoạt động máy tính dựa theo các nguyên tắc của nó. Đại số Boolean bao gồm rất nhiều chủ đề, trong đó có lý thuyết tập hợp, số nhị phân, không gian xác suất, cấu trúc mạch điện tử và công nghệ máy tính. Nhiều ý tưởng của Boole hiện giờ được coi như hiển nhiên và được tìm thấy trong lý thuyết tập hợp và xác suất sơ cấp. Nó mang lại những ứng dụng rộng rãi trong các lĩnh vực như chẩn đoán y tế, bảo hiểm và chứng cứ pháp lý.
4. Boole và Hamilton
Boole đã từng thử làm thơ, tuy nhiên giống với người bạn của mình - William Rowan Hamilton, những tác phẩm thơ của ông không có gì đặc sắc. Cả một chương được dành riêng để nói về sự thiếu liên lạc đáng ngạc nhiên giữa hai người đàn ông. Boole sinh sau Hamilton 10 năm và cùng qua đời trong một năm. Họ có rất nhiều sở thích chung trong cả toán học lẫn niêm luật thơ, và cũng có rất nhiều cơ hội để có thể cộng tác hay ít nhất là tương tác. Tuy nhiên, sự hạn chế tiếp xúc giữa hai người cho thấy giữa họ có thể có một số khó khăn đáng kể hoặc một sự bất đồng quan điểm, mặc dù không có bằng chứng rõ ràng nào về điều này. Vào năm 1985; MacHale viết rằng những bí mật về mối quan hệ giữa họ vẫn chưa được bật mí. Chương này có tiêu đề “Một số câu hỏi chưa được trả lời”. Tuy nhiên, điều đáng thất vọng là sau hơn 30 năm, không hề có thêm thông tin nào về điều này.3
3MacHale đã nói với tôi rằng anh ấy có một suy đoán mới về sự rạn nứt trong mối quan hệ, thế nhưng chúng ta bắt buộc phải kiên nhẫn chờ đợi cho đến khi thông tin về điều này xuất hiện ở đâu đó.
57
Tạp chí Epsilon, Số 06, 12/2015
5. Gia đình
Chương cuối cùng khá là thú vị mặc dù là thông tin ngoài lề. George và Mary Boole có 5 người con gái, tất cả đều đặc biệt theo những cách khác nhau. Alicia đã có những khám phá quan trọng trong hình học 4 chiều. Cô đã đưa vào thuật ngữ “polytope” chỉ sự tương đương 4 chiều của một khối đa diện. GI Taylor, nhà thủy khí động lực học tiên phong của thế kỉ 20; là con của con gái Boole-Margaret. Một người con gái khác, Ethyl Lilian (Voynich) sống một cuộc đời phiêu lưu và là tác giả cuốn tiểu thuyết “Ruồi Trâu” vô cùng phổ biến ở Nga. Câu chuyện về cuộc đời cô cũng rất hấp dẫn.
Kết thúc chương cuối- “những năm tháng cuối cùng”, MacHale viết về Boole: “Tên của ông sẽ sống mãi tựa như những máy tính kỹ thuật số luôn phụ thuộc vào đại số Boolean để vận hành, và miễn là khi các sinh viên toán học vẫn còn nghiên cứu lý thuyết vành, phương trình vi phân, lý thuyết xác suất, phương trình sai phân, lý thuyết bất biến, lý thuyết toán tử, lý thuyết tập hợp và tất nhiên, cuốn SÁCH 101 logic”. Ông kết bút bằng ghi chú rằng Boole sẽ vô cùng vui mừng khi được biết tất cả các thông tin liên lạc hiện đại, cho dù đó là dữ liệu, văn bản hay hình ảnh, luôn bao gồm các chuỗi dài của những biểu tượng Boolean 0 và 1:
6. Lời kết
Cuốn sách được xuất bản một cách rất kỳ công và dường như không có lỗi. Một vấn đề nhỏ có thể làm người đọc khó hiểu là việc nhắc đi nhắc lại về Lebesgue. Nhà phân tích Henri Lebesgue chưa được sinh ra cho đến năm 1875; rất lâu sau cái chết của Boole. Tài liệu tham khảo lẽ ra thuộc về nhà số học Victor-Am’ed’ee .1791 1875/ nhưng lại liệt kê Henri trong phần bảng mục lục. Một vấn đề nghiêm trọng hơn là việc bỏ qua phụ lục danh sách 27; phần “Các tài liệu tham khảo bổ sung”, đã từng xuất hiện trong phiên bản đầu tiên nhưng lại bị bỏ đi từ những phiên bản tiếp theo. Một số trích dẫn quá dài kèm theo một số đoạn lạc đề và tối nghĩa. Ví dụ như việc thêm vào một danh sách dài dặng dặc những nhà tư tưởng tôn giáo cùng thời đại đã ảnh hưởng lớn đến Boole. Việc làm đó có nên hay không là tất nhiên một vấn đề về quan điểm và tôi cảm thấy rằng nó sẽ khiến cho cậu chuyện về Boole của chúng ta bị gián đoạn.
Người đọc tập san đôi khi cảm thấy mức độ chi tiết của toán học là không đầy đủ. Thật sự, với những độc giả toán học có cùng ý tưởng với của công trình của Boole và muốn đào sâu hơn nữa về mảng kiến thức này sẽ không thật sự thấy cuốn sách là lý tưởng cho mục đích đó, và họ sẽ phải đọc lại những ấn phẩm gốc của Boole. Tuy nhiên, có một danh sách khá đầy đủ và giá trị về các vấn đề được nêu trong cuốn sách.
Peter Lynch Peter Lynch là Giáo sư Khoa học Khí tượng tại UCD. Chuyên môn của ông bao gồm khí động học, dự báo thời tiết số, cơ học Hamilton và lịch sử của khí tượng học. Ông viết một số ấn phẩm toán học trong phần “Đây Toán học” trong “Thời báo Ai-len”. Xem blog của ông tại http://thatsmaths.com
Trường Khoa học Toán học, Đại học College Dublin.
E-mail: [email protected]
58
NHẬN DẠNG CHÓ MÈO
Bình Nguyễn
(Trường Đại học Khoa học Tự nhiên, ĐHQG - TP.HCM)
TÓM TẮT
Toán học không khô khan như nhiều người từng nghĩ mà gắn liền mật thiết với cuộc sống xung quanh chúng ta. Đã từ lâu nay, có rất nhiều ứng dụng thiết thực được xây dựng dựa trên các cơ sở toán học bao gồm các phép biến đổi và thuật toán cơ bản như biến đổi Fourier, biến đổi Wavelet, thuật toán SVD (singular value decomposition), thuật toán LDA (Linear Discrimination Analysis), thuật toán phân rã trị riêng (eigen decomposition)... Trong số đó, có thể nói đến các ứng dụng liên quan đến nhận dạng hình ảnh (image recognition) trên điện thoại thông minh (smart phones), nơi người ta có thể quan sát hình ảnh trong ngôi nhà của mình thông qua một camera, tự động nhận được tin nhắn khi có người lạ đột nhập vào nhà, hoặc biết được các thú cưng ở nhà có đang lén lút làm gì không. Trong bài viết này, tác giả sẽ giới thiệu độc giả xây dựng một hệ thống nhận dạng chó mèo đơn giản thông qua các thuật toán cơ bản trong Toán học.
1. Giới thiệu
Bài viết tập trung vào việc xây dưng một hệ thống thông minh có thể phân biệt được chó và mèo. Nếu nhìn bằng mắt thường, không khó để bất cứ ai có thể thực hiện chính xác việc này. Vấn đề đặt ra ở đây là trong trường hợp có một bộ ảnh chó mèo cho trước, làm sao chúng ta tìm ra một phương pháp giúp cho một máy tính có thể nhận biết hình ảnh chó mèo. Hệ thống càng thông minh khi đạt được độ chính xác gần giống như con người.
Để nhận biết được ảnh chó mèo từ một bức ảnh, thông thường chúng ta sẽ dựa vào các đường nét bên trong bức ảnh đó. Ảnh chó sẽ chứa một số nét đặc trưng góc cạnh (edge) riêng biệt giúp chúng ta phân biệt được với ảnh mèo. Trong phân tích thời gian - tần số, biến đổi Wavelet được
Hình 7.1: Chó và mèo
59
Tạp chí Epsilon, Số 06, 12/2015
Hình 7.2: Một số ảnh chó mèo trong tập huấn luyện.
biết như là một trong những phương pháp hữu ích để biểu diễn thông tin tín hiệu theo nhiều tỉ lệ khác nhau. Không những thế, biến đổi wavelet còn cực kỳ hữu ích trong việc dò tìm cạnh (edge detection) trong một bức ảnh. Chính vì thế, trong bài toán này, chúng tôi sẽ sử dụng biến đổi wavelet để biểu diễn thông tin trong các ảnh chó mèo.
Như đã đề cập trước đó, bài viết này sẽ giới thiệu một thuật toán đơn giản giúp máy tính có thể phân biệt được giữa chó và mèo. Thuật toán sẽ bao gồm các bước sau đây:
Bước 0: cho trước M ảnh chó và M ảnh mèo trong tập huấn luyện (training set).
Bước 1: Phân rã (decompose) các ảnh chó mèo thông qua các hàm wavelet cơ sở (Wavelet basis functions). Mục đích của bước này là thực hiện thao tác dò tìm cạnh (edge detection) trong bức ảnh.
Bước 2: Từ các ảnh mở rộng wavelet (wavelet expanded images) trong tập huấn luyện, dùng thuật toán SVD để tìm kiếm cách thành phần chính (the principal components) liên quan tương ứng đến chó và mèo.
Bước 3: Tìm kiếm một ngưỡng quyết định để phân biệt giữa chó và mèo bằng thuật toán LDA (liner discrimination analysis).
Bước 4: Kiểm tra tính hiệu quả của thuật toán trên N ảnh chó và N ảnh mèo. Thông thường, người ta chọn tỉ lệ M W N D 4 W 1 .
Trong những phần tiếp theo, độc giả sẽ được tìm hiểu sâu hơn từng bước trong thuật toán trên. 60
Tạp chí Epsilon, Số 06, 12/2015
Hình 7.3: Chó Bull.
2. Xây dựng thuật toán
Để minh hoạ cho thuật toán, chúng ta xét bức ảnh chó Bull trong Hình 7.3. Trong tập huấn luyện, chúng ta có tất cả 98 ảnh chó và 98 ảnh mèo và tất cả các ảnh để được điều chỉnh kích cỡ về kích thước 64x64. Quá trình tiền xử lý này được mô tả như trong hàm preprocess.m dưới đây.
function [newImage] = preprocess(imagePath)
oldImage = imread(imagePath);
newImage = imresize(oldImage,[64,64]);
end
Sau đó, tất cả các ảnh huấn luyện sẽ được phân rã thành các cơ sở wavelet bằng cách sử dụng biến đổi wavelet rời rạc. Trong Matlab, đọc giả có thể sử dụng hàm dwt2 sau đây để thực hiện phép biến đổi wavelet rời rạc hai chiều cho các ảnh này:
[cA, cH, cV, cD] = dwt2(X,wname)
Ở đây, cA là ma trận hệ số thành phần xấp xỉ (the approximation coefficient matrix) còn cH, cV , và cD là ma trận hệ số thành phần chi tiết (the detail coefficient matrix) tính được thông quá việc phân tích ảnh đầu vào X. Tham số wname đại diện cho tên hàm wavelet được sử dụng. Trong ví dụ này, chúng ta sẽ sử dụng bộ lọc Haar để thực hiện quá trình phân rã wavelet.
Trong hình 7.4 và hình 7.5, chúng ta có thể thấy phân rã Wavelet của hình một con chó. Sau khi phân rã ảnh chó mèo bằng biểu diễn wavelet, chúng ta sẽ tìm phương pháp tiếp cận để có thể phân biệt được ảnh chó và mèo. Để thực hiện điều này, một trong những cách chúng ta có thể tiếp cận là phân rã tập ảnh chó mèo bằng thuật toán SVD, nghĩa là chó mèo sẽ được biểu diễn bằng các thành phần chính (principal components). Sau đó, chúng ta sẽ dùng phương pháp LDA để huấn luyện một hệ thống phân biệt được chó mèo.
Nhìn chung, thuật toán chúng ta sẽ tiến hành những bước sau đây:
61
Tạp chí Epsilon, Số 06, 12/2015
Hình 7.4: Biến đổi Wavelet trên bức ảnh chó Bull (ảnh 7.3) tạo thành bốn ma trận: cA, cH, cV và cD (từ trái sang phải, từ trên xuống dưới).
Hình 7.5: Trong hình này, từ trái qua phải, từ trên xuống dưới lần lượt biểu diễn theo chiều ngang, chiều dọc, ảnh dò tìm cạnh và hình ảnh tổng hợp lại từ biến đổi Wavelet của ảnh chó Bull ban đầu.
62
Tạp chí Epsilon, Số 06, 12/2015
dog_folder_path=’./training/dog’;
cat_folder_path=’./training/cat’;
dog_wave = dc_wavelet(dog_folder_path);
cat_wave = dc_wavelet(cat_folder_path);
feature=20;
[result,w,U,S,V,th] = dc_trainer(dog_wave,cat_wave,feature);
Trong thuật toán trên, các ảnh về chó và mèo sẽ được đưa vào hệ thống và sau đó được đưa vào thuật toán Wavelet được mô tả như sau:
function [dcData] = dc_wavelet(dc_folder_path)
allFiles=dir(dc_folder_path);
allNames = fallFiles.nameg;
nw=32*32;
index=1;
for i = 1:length(allNames)
filename=fullfile(allNamesfig);
filename=fullfile(dc_folder_path,filename);
display(filename)
I=imread(filename);
J=imresize(I,[64,64]);
J=rgb2gray(J);
[ ,cH,cV, ] = dwt2(J,’Haar’);
nbcol = size(colormap(gray),1);
cod_cH1 = wcodemat(cH,nbcol);
cod_cV1 = wcodemat(cV,nbcol);
cod_edge=cod_cH1+cod_cV1;
dcData(:,index)=reshape(cod_edge,nw,1);
end end
Thuật toán huấn luyện được mô tả như trong hàm dc_trainer.m.
function [result,w,U,†,V,threshold]=dc_trainer(dog0,cat0,feature)
nd=length(dog0(1,:));
nc=length(cat0(1,:));
[U,†,V] = svd([dog0,cat0],0);
animals = †*V’;
U = U(:,1:feature);
dogs = animals(1:feature,1:nd);
cats = animals(1:feature,nd+1:nd+nc);
md = mean(dogs,2);
mc = mean(cats,2);
Sw=0;
for i=1:nd
Sw = Sw + (dogs(:,i)-md)*(dogs(:,i)-md)’;
end
63
Tạp chí Epsilon, Số 06, 12/2015
for i=1:nc
Sw = Sw + (cats(:,i)-mc)*(cats(:,i)-mc)’;
end
Sb = (md-mc)*(md-mc)’;
[V2,D] = eig(Sb,Sw);
[lambda,ind] = max(abs(diag(D)));
w = V2(:,ind); w = w/norm(w,2);
vdog = w’*dogs; vcat = w’*cats;
result = [vdog,vcat];
if mean(vdog)>mean(vcat)
w = -w;
vdog = -vdog;
vcat = -vcat;
end
sortdog = sort(vdog);
sortcat = sort(vcat);
t1 = length(sortdog);
t2 = 1;
while sortdog(t1)>sortcat(t2)
t1 = t1-1;
t2 = t2+1;
end
threshold = (sortdog(t1)+sortcat(t2))/2;
end
Có thể thấy, trong bước đầu tiên của quá trình huấn luyện, chúng ta sử dụng phân rã SVD trên dữ liệu tạo ra từ biến đổi Wavelet cho từng ảnh huấn luyện. Với tập huấn luyện gồm 98 ảnh mèo và 98 ảnh chó, sau khi thực hiện phép biến đổi Wavelet, chúng ta thu được một véc tơ có tổng độ dài 32 32 D 1024. Kết hợp dữ liệu huấn luyện (98 C 98 D 196 ảnh), chúng ta sẽ tạo ra được ma trận mới có kích thước 1024 196. Đến bước này, chúng ta sẽ sử dụng thuật toán SVD dạng rút gọn trên ma trận này để có thể trích ra được các thành phần chính U, † và V .
Tuy nhiên, chúng ta không nhất thiết phải sử dụng tất cả các thành phần chính (principal components) thu được từ thuật toán SVD để làm đặc trưng cho việc nhận dạng. Ở đây, chúng ta chỉ cần dùng một số lượng vừa đủ các thành phần chính, cái mà được xác định thông qua biến feature. Giả sử số lượng thành phần chính chúng ta chọn là 20. Khi đó, từ ma trận U và †V thu được, chúng ta sẽ trích ra 20 cột đầu tiên của ma trận U và 20 dòng đầu tiên của ma trận †V . Trong hình 7.6, độc giả có thể thấy các hình ảnh minh họa tương ứng bốn thành phần chính đầu tiên của ảnh chó mèo trích ra từ tập huấn luyện.
Một câu hỏi đặt ra tại sao chúng ta lại sử dụng ma trận †V ? Như đã biết, † là ma trận đường chéo mà các thành phần đường chéo của nó chính là singular value của ma trận 1024 196 ban đầu. Chính vì thế, việc chọn ma trận †V sẽ tạo nên trọng số cho các mode của một ảnh (mèo hoặc chó) cho trước khi chiếu lên †V .
Sau khi chúng ta thực hiện các bước phân rã Wavelet và SVD cho từng bức ảnh chó mèo trong tập huấn luyện, chúng ta sẽ tìm cách sử dụng những thông tin này để quyết định xem ảnh cho
64
Tạp chí Epsilon, Số 06, 12/2015
Hình 7.6: Minh hoạ cho bốn thành phần chính đầu tiên (principal components) của tập ảnh chó mèo. Những thành phần thế này sẽ được sử dụng làm cơ sở để phân loại một ảnh chó hoặc mèo.
trước là ảnh con vật nào. Thuật toán LDA 2-lớp được sử dụng trong bài toán này. Một trong những mục tiêu của thuật toán LDA chính là tìm ra phép chiếu hiệu quả nhất sao cho dữ liệu khi chiều xuống một không gian con cho trước có thể phân chia tốt.
Như trong hình 7.7, với dữ liệu hai lớp cho trước, phép chiếu LDA đã tạo ra một phân bố lý tưởng cho dữ liệu khi giá trung bình của dữ liệu hai lớp trên hệ trục mới 1 và 2 hoàn toàn tách rời nhau. Nếu xét về khía cạnh toán học, phép chiếu trên thoả mãn:
w D arg max w
wT SB w
wT SW w; (2.1)
trong đó, các ma trận phân tán giữa các lớp SB và trong một lớp SW được tính như sau: SB D . 2 1/. 2 1/T(2.2)
SW DX2 iD1
X x
.x i/.x i/T(2.3)
Dễ thấy, nghiệm của bài toán 2.4 chính là véc tơ riêng tương ứng với trị riêng lớn nhất của bài toán trị riêng:
SB w D Sw w: (2.4)
Để giải được bài toán trị riêng trên, chúng ta có thể dùng hàm eig trong Matlab để tìm giá trị w tương ứng. Như vậy với các ảnh chó mèo nằm trong tập huấn luyện ban đầu, chúng ta sẽ chiếu xuống cơ sở LDA để thu được phân bố tương ứng. Khi đó, chúng ta cần tìm một ngưỡng (threshold) để giúp phân loại một bức ảnh nằm trong nhóm con vậy nào. Tuy nhiên, thuật toán vẫn không tránh khỏi một số trường hợp ảnh mèo nhận nhầm thành ảnh chó và ngươc lại. Càng nhiều đặc trưng sử dụng, chúng ta hi vọng càng giảm số lỗi trong quá trình nhận dạng.
65
Tạp chí Epsilon, Số 06, 12/2015
Hình 7.7: Phép chiếu LDA tạo ra một phân bố lý tưởng và dữ liệu thu được trên hệ trục mới hoàn toàn có thể phân chia thành hai lớp khác nhau.
Để kiểm tra chất lượng đạt được của hệ thống vừa xây dựng, chúng ta tiến hành kiểm tra với 16 ảnh mèo và 16 ảnh chó (hoàn toàn độc lập với tập ảnh huấn luyện ban đầu).
%Test on the testing dataset:
testing_set=’./testing’
% wavelet transformation
testing_wavelet = dc_wavelet(testing_set);
% SVD projection
TestMat = U’*testing_wavelet;
% LDA projection
pval = w’*TestMat;
% 16 cats and 16 dogs
hiddenlabels=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1
,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
TestNum = length(pval);
%cat = 1, dog = 0
ResVec = (pval>threshold)
disp(’Number of mistakes’);
errNum = sum(abs(ResVec - hiddenlabels))
disp(’Rate of success’);
sucRate = 1-errNum/TestNum
Với bộ dữ liệu chúng tôi đã xét, tỉ lệ nhận dạng đúng đạt được khoảng 72%. Chúng tôi xin nhường lại phần cải tiến cho độc giả của Epsilon trong số báo này. Đoạn codes tham khảo có thể tìm thấy tại: Pet-recognition.
Acknowledgement
Tác giả chân thành cảm ơn TS. Lê Phong và TS. Đặng Nguyễn Đức Tiến đã sửa lỗi và góp ý cho bản thảo.
66
BÀI TOÁN CÂN TIỀN
Đặng Nguyễn Đức Tiến
(Đại học Trento, Italia)
LỜI GIỚI THIỆU
Tiếp nối những số báo trước, chuyên mục Toán học Giải trí kỳ này giới thiệu với độc giả một bài toán logic kinh điển: Bài toán cân tiền (counterfeit coin problem).
Dạng thức chung của các bài toán cân tiền là có một hoặc một số đồng tiền giả được đặt lẫn lộn với các đồng tiền thật. Các đồng tiền giả có bề ngoài giống hệt tiền thật nhưng khác khối lượng so với tiền thật. Cần sử dụng cân đĩa hoặc cân số với một số lần cân xác định để tìm ra (một hoặc một số) đồng tiền giả này. Ở đây chúng tôi cũng nhắc lại hai khái niệm về hai loại cân được sử dụng. Cân đĩa giúp chúng ta so sánh khối lượng của các vật được đặt ở 2 bên của đĩa cân và kết quả trả về hoặc nặng hơn, hoặc nhẹ hơn, hoặc cân thăng bằng. Cân số cho phép xác định chính xác khối lượng của vật được đặt trên cân. Trong các bài toán được trình bày ở số này, chúng tôi luôn giả sử rằng các cân được sử dụng luôn có độ chính xác tuyệt đối.
Tương tự như bài toán đội nón, bài toán cân tiền đầu tiên theo chúng tôi ra đời từ rất sớm, nhưng mãi đến giữa thế kỷ 20, những lời giải đầu tiên mới chính thức được ghi nhận và công bố. Và cũng tương tự như bài toán anh em của mình, bài toán cân tiền có rất nhiều biến thể khác nhau, mà hiện tại chúng tôi sưu tập được hơn 53 phiên bản của bài toán này.
Trong chuyên mục Toán học Giải trí kỳ này, chúng tôi chọn lọc giới thiệu với bạn đọc 5 bài toán cân tiền sử dụng cân đĩa. Trong số tiếp theo, chúng tôi sẽ giới thiệu những bài toán sử dụng cân số.
Và bây giờ, xin mời bạn đọc hãy sang trang tiếp theo để đến với bài toán cân tiền đầu tiên ...
67
Tạp chí Epsilon, Số 06, 12/2015
1. Bài toán cân tiền với 9 đồng xu
Bài toán cân tiền đầu tiên có phát biểu như sau:
Có 9 đồng xu giống hệt nhau, trong đó có một đồng giả nặng hơn 8 đồng còn lại. Sử dụng cân đĩa và không sử dụng thêm quả cân, bằng 2 lần cân, hãy chỉ ra đồng giả.
Bài toán này khá đơn giản và xuất hiện trong rất nhiều tạp chí cũng như sách về toán học vui, giải trí. . . Bạn đọc hẳn sẽ nhanh chóng tìm ra phương án cho bài toán với cách cân như sau:
Lần 1: Đặt mỗi đĩa cân 3 đồng. Ta có 2 trường hợp: cân thăng bằng hoặc cân lệch. Nếu cân thăng bằng, ta suy ra đồng giả thuộc về 3 đồng chưa cân. Nếu cân lệch, ta suy ra đồng giả thuộc về nhóm 3 đồng nặng hơn. Như vậy, ta luôn xác định được nhóm 3 đồng nào có chứa đồng giả.
Lần 2: Chọn 2 đồng trong 3 đồng vừa xác định và đặt ở mỗi đĩa cân 1 đồng. Ta cũng có 2 trường hợp ở đây: Nếu cân thăng bằng, suy ra đồng chưa cân là đồng giả. Nếu cân lệch, thì đồng nặng hơn là đồng giả.
Như vậy, với 2 lần cân, ta xác định được đồng giả (biết trước nặng hơn) trong số 9 đồng.
Ta có thể nâng cấp bài toán lên 27 đồng với 3 lần cân, trong đó lần đầu cân mỗi bên 9 đồng và áp dụng phương pháp tương tự khi đã biết đồng giả ở 9 đồng nào. Tổng quát hóa bài toán với n lần cân, ta có thể xác định được đồng giả (biết trước nặng hơn) trong số 3nđồng!
Bài toán trên khá đơn giản, nhưng khi thay đổi một ít điều kiện, ta có được những bài toán hóc búa và vô cùng thú vị, mà tiêu biểu là bài toán tiếp theo đây.
2. Bài toán 12 đồng xu
Theo chúng tôi, đây là bài toán kinh điển và nổi tiếng nhất trong số các bài toán cân tiền. Phiên bản đầu tiên mà chúng tôi tìm được xuất phát từ Dyson và Lyness vào năm 1946 [1].
Phát biểu bài toán như sau:
68
Tạp chí Epsilon, Số 06, 12/2015
Có 12 đồng xu giống hệt nhau, trong đó có một đồng giả có khối lượng khác với 11 đồng còn lại, nhưng không biết nặng hơn hay nhẹ hơn. Sử dụng cân đĩa và không sử dụng thêm quả cân, bằng 3 lần cân, hãy chỉ ra đồng giả.
Thoạt nhìn, bài toán này khá giống với bài toán 9 đồng xu đầu tiên. Tuy nhiên, với yếu tố khác biệt là chúng ta không biết được đồng giả nhẹ hơn hay nặng hơn so với đồng thật. Và với yếu tố này, bài toán trở nên khó khăn hơn khá nhiều.
Trước khi bước sang phần lời giải, chúng tôi hi vọng độc giả hãy dành ra ít thời gian để thử sức với bài toán này để thấy được sự thú vị của nó. Một trong những khảo sát chi tiết đầu tiên của bài toán này độc giả có thể xem ở [2] bởi Richard Bellman, một trong những nhà toán học tiên phong về Quy hoạch động.
Và bây giờ, chúng tôi giới thiệu 3 cách giải khác nhau cho bài toán này cũng như mở rộng cho bài toán.
2.1. Cách giải logic
Chúng tôi đã sử dụng bài toán này ở các diễn đàn Toán học, các chuyên mục đố vui cũng như với bạn bè trong hơn 15 năm qua và đây là cách giải mà chúng tôi hay nhận được nhất. Vì bản chất cách giải này là chuỗi suy luận logic nên chúng tôi tạm gọi phương pháp này là cách giải logic.
Cách làm này như sau: Chia 12 đồng thành 3 nhóm và đặt tên cho các đồng tương ứng với các nhóm là aaaa, bbbb và cccc.
Lần 1: Cân aaaa và bbbb
Trường hợp 1. Nếu cân thăng bằng, ta suy ra 8 đồng aaaa và bbbb đều thật.
Lần 2: đặt 3 đồng bất ỳ trong 8 đồng này và 3 đồng trong 4 đồng còn lại, ví dụ aaa và ccc. Ở đây sẽ có 2 trường hợp:
Trường hợp 1.1. Nếu cân thăng bằng, suy ra đồng c còn lại giả. Ta cân lần 3 sẽ biết nặng nhẹ.
Trường hợp 1.2. Nếu cân lệch, ta biết đồng giả trong 3 đồng ccc, và ta biết được nặng hay nhẹ. Lần cuối đơn giản cân 2 đồng số 3 đồng ccc này với nhau. Nếu cân bằng, c còn lại giả (đã biết nặng nhẹ), nếu không cân bằng, cũng xác định được.
Trường hợp 2. Nếu cân lệch, ta suy ra 4 đồng cccc đều thật. Không mất tính tổng quát, giả sử aaaa < bbbb.
Lần 2: cân accc và baaa (mấu chốt ở đây là tách nhóm a và b ra sao cho thành 1 bộ 1 đồng và 1 bộ 3 đồng). Có 3 trường hợp như sau:
Trường hợp 2.1. Nếu cân bằng, suy ra 3 đồng bbb còn lại là giả nặng, và với lần cuối ta sẽ xác định được.
69
Tạp chí Epsilon, Số 06, 12/2015
Trường hợp 2.2. Nếu accc < baaa thì hoặc đồng a này giả nhẹ, hoặc đồng b giả nặng. Lần cuối cân c và a hoặc b ta sẽ xác định được.
Trường hợp 2.3. Nếu accc > baaa thì đồng giả trong 3 đồng aaa, và là giả nhẹ. Với lần cuối ta cũng xác định được.
Và như vậy, bài toán được giải quyết trọn vẹn với 3 lần cân.
2.2. Cách giải gán nhãn
Cách giải này theo ghi nhận của chúng tôi được đề xuất bởi Brian D. Bundy vào năm 1996 ở [4].
Trước khi đi vào phân tích cách giải này, chúng tôi nêu một đáp án ví dụ như sau: gán số từ 1 đến 12 cho 12 đồng và thực hiện 3 lần cân:
Lần 1: Cân (1, 2, 7, 10) và (3, 4, 6, 9)
Lần 2: Cân (1, 3, 8, 11) và (2, 5, 6, 7)
Lần 3: Cân (2, 3, 9, 12) và (1, 4, 5, 8)
Khi đó với kết quả 3 lần cân, cách làm này sẽ xác định được đồng nào là giả và giả nặng hay nhẹ!
Ví dụ nếu như ta có 3 kết quả là lần 1 bằng nhau, lần 2: bên phải nặng hơn, lần 3: bên trái nặng hơn, ta sẽ biết đồng giả là đồng 8 và đồng này nhẹ hơn.
Làm sao có được điều này? Ta thấy rằng mỗi lần cân sẽ có 3 khả năng, cân bằng (ký hiệu 0), bên trái nặng hơn (ký hiệu T ) hoặc bên phải nặng hơn (ký hiệu P). Và ứng với 12 đồng thì ta có 24 khả năng là mỗi đồng là giả và giả nặng hay giả nhẹ. Do vậy, cách làm là tìm cách chia các quả cân sao cho mỗi bộ kết quả của 3 lần cân sẽ ứng với một đáp số duy nhất, ví dụ như kết quả T TP ta sẽ có tương ứng đáp số “đồng 1 giả nặng”, kết quả TP T sẽ có đáp số “đồng 2 giả nặng” ... Cách làm này không những chỉ ra đồng giả, và giả nặng hay nhẹ mà còn chỉ ra cách xếp các quả cân như thế nào cho phù hợp.
Bây giờ ta cùng phân tích cách làm. Xét 2 nhận xét sau:
Nhận xét 1: Ta có 27 khả năng khác nhau của các lần cân (33 D 27) và 24 kết quả phân biệt. Ta loại bỏ trường hợp cùng đặt một đồng ở cùng 1 bên cân trong cả 3 lần cân (do đặt như vậy thì sẽ không cân đủ). Khi đó 3 trường hợp 000, T T T và PPP bị loại bỏ và ta còn lại 24 khả năng ứng với 24 đáp số!
Nhận xét 2: Ta thấy nếu kết quả 0P T ứng với đáp án “đồng 8 giả nhẹ” thì kết quả đối xứng là 0TP, phải cho ra “đồng 8 giả nặng” do 0TP cho thấy đồng 8 (giả) xuất hiện ở 2 lần cân sau. Vì vậy ta có thể phân 24 khả năng thành 2 nhóm, mỗi nhóm ứng với 12 đồng xu.
Hai nhận xét trên chính là cơ sở để tìm ra cách gán: Ta ghi ra 12 phương án phân biệt và không chứa phương án đối xứng thành 12 cột, 3 dòng, mỗi dòng có đúng 4 0, 4 T và 4 P và không có cột nào có 000, T T T , hoặc PPP. Sau đó gán thứ tự từ 1 đến 12 ứng với 12 đồng.
70
Tạp chí Epsilon, Số 06, 12/2015
T T T T P P P P 0 0 0 0
0 0 0 T T T T P P P P 0
T P 0 P 0 T P 0 T P 0 T
1 2 3 4 5 6 7 8 9 10 11 12
Ví dụ như sau (để tìm ra cách gán thỏa yêu cầu không khó nhưng cũng cần phải có chiến thuật, ở đây chúng tôi xin phép lược bớt và cách gán sau đây cũng chính là gợi ý):
Để chọn các đồng xu trong các lần cân, ta đặt theo từng dòng, nếu là T , ta đặt đồng xu bên trái và P, ta đặt bên phải. Khi đó nếu phương án ra đúng với thứ tự, sẽ là giả nặng và ngược lại ta xét đối xứng và có giả nhẹ. Với phương án như ví dụ ở trên, ta có:
Lần 1: (1, 2, 3, 4) và (5, 6, 7, 8)
Lần 2: (4, 5, 6, 7) và (8, 9, 10, 11)
Lần 3: (1, 6, 9, 12) và (2, 4, 7, 10)
Ta thấy đây là một cách khác sắp xếp các đồng xu khác với cách nêu ra đầu tiên. Thử xét vài ví dụ như sau:
- Nếu như kết quả là T TP, tra vào bảng đã lập ta thấy sẽ ứng với “4”, và vì vậy đây là “4 giả nặng”.
- Nếu kết quả là P 0T , tra vào bảng ta thấy không có, vậy đó là giả nhẹ, và lấy đối xứng ta có T 0P, ứng với đồng 2, vậy đây là “2 giả nhẹ”.
Và với cách làm này, ta có thể tổng quát lên với n lớn hơn 3. Các mở rộng khác của bài toán cũng có thể làm dựa trên cơ sở này. Tuy nhiên, nhược điểm là với n lớn, để tránh sai sót trong gán nhãn thường ta cần đến sự trợ giúp của máy tính.
2.3. Cách giải Jack Wert
Đây là cách giải yêu thích nhất của người viết bài này, theo ghi nhận của trang Cut The Knot thì lời giải được đưa ra bởi Jack Wert [5], do vậy chúng tôi dùng tên tác giả để gọi cho phương pháp này.
Về mặt ý tưởng, cách làm này khá giống như cách đầu tiên, nhưng được tác giả phát biểu ở hình thức dễ hiểu hơn và có thể tổng quát hóa lên với trường hợp n > 3 khá dễ dàng.
Cách làm của Jack Wert cho bài toán này như sau:
Chia 12 đồng thành 3 nhóm, mỗi nhóm 4 đồng và trong mỗi nhóm chia thành một "đống" 3 đồng và một "đống" 1 đồng lẻ (ví dụ như gói 3 đồng này vào một bao giấy và giả sử khối lượng bao bằng 0).
Lần 1: Đặt ở mỗi đĩa cân 2 nhóm đầu tiên và ghi nhận tình trạng cân.
71
Tạp chí Epsilon, Số 06, 12/2015
Lần 2: Hoán đổi các "đống" lớn: "đống" ở cân bên trái qua cân bên phải, "đống" ở cân bên phải đặt ra ngoài và "đống" chưa cân đặt ở cân bên trái. Ghi nhận tình trạng cân.
Nếu tình trạng cân thay đổi: ta xác định được đống nào có chứa đồng giả, và giả nặng hay giả nhẹ. Với 1 lần cân còn lại, ta sẽ biết được đồng giả này. Nếu tình trạng cân không thay đổi: ta biết đồng giả sẽ ở vào một trong các đồng lẻ và với 1 lần cân, ta cũng xác định được đồng giả này và biết được giả nặng hay giả nhẹ. Một cách lý giải tuyệt đẹp mà không cần phải gán nhãn!
Bây giờ chúng ta hãy thử xem làm cách nào để mở rộng cách giải này cho n lớn hơn, ví dụ 1092 đồng với 7 lần cân: ta cũng chia thành 3 nhóm, mỗi nhóm gồm 364 đồng. Sau đó, trong mỗi nhóm, ta “gói” các đồng thành từng đống 243, 81, 27, 9, 3, 1 đồng (6 “đống”).
Lần 1: Đặt toàn bộ 6 đống của mỗi 2 nhóm lên cân. Ghi nhận tình trạng cân.
Lần 2: Hoán đổi đống lớn nhất (chứa 243 đồng) từ cân bên trái sang cân bên phải, từ cân bên phải ra ngoài và từ bên ngoài vào cân bên trái. Ghi nhận tình trạng cân.
Nếu tình trạng cân thay đổi, ta biết đống nào chứa đồng giả và nặng hay nhẹ tương ứng. Và ta tìm được đồng giả trong 243 đồng này sau 5 lần cân (35 D 243, do đã biết giả nặng hay giả nhẹ).
Nếu cân không thay đổi, hoán chuyển đến đống thứ 2 (đống chứa 81 đồng) và ghi nhận tình trạng cân. Nếu cân thay đổi, ta biết đồng giả ở đống nào cùng với tính nặng/nhẹ tương ứng, và tìm ra được đồng này sau 4 lần cân. Nếu cân lại không thay đổi tình trạng, ta lại tiếp tục hoán chuyển đống tiếp theo (27 đồng) và cứ như vậy cho đến đống cuối cùng, và ta luôn sử dụng tối đa 7 lần cân!
Bằng cách làm này, dễ thấy lời giải tổng quát với n lần cân, ta có thể xác định được đồng giả và là giả nặng hay giả nhẹ trong .3n 3/=2 đồng!
72
Tạp chí Epsilon, Số 06, 12/2015
3. Nặng hơn hay nhẹ hơn?
Bài toán cân tiền thứ 3 này chúng tôi trích nguồn quen thuộc từ blog của Tanya Khovanova, là một biến thể khá thú vị (nhưng dễ hơn) của bài toán ở trên.
Có N > 2 đồng xu giống hệt nhau, trong đó có một đồng giả có khối lượng khác với các đồng còn lại, nhưng không biết nặng hơn hay nhẹ hơn. Sử dụng cân đĩa và không sử dụng thêm quả cân, hãy xác định số lần cân ít nhất để xác định đồng giả là nặng hơn hay nhẹ hơn so với các đồng khác mà không yêu cầu phải xác định cụ thể đồng giả này.
Sau đây là lời giải của bài toán được đăng bởi tác giả (Tanya Khovanova): Chỉ cần 2 lần cân là ta có thể xác định được đồng giả là nặng hơn hay nhẹ hơn so với các đồng còn lại.
Trường hợp N D 3, đơn giản ta chỉ so sánh từng cặp hai đồng xu với nhau.
Xét trường hợp N D 4. Ta cân lần đầu mỗi bên 2 đồng. Cân không thể cân bằng. Không mất tính tổng quát, giả sử cân bên trái nhẹ hơn. Lần 2 so sánh 2 đồng bất kỳ ở cân bên trái, nếu cân bằng, ta biết đồng giả ở nhóm còn lại và biết được là giả nặng. Nếu cân lệch, ta biết được đồng nhẹ hơn là giả nhẹ.
Như vậy, ta có thể tổng quát lên trường hợp N D 3k và N D 4k với cách làm tương tự.
Với N bất kỳ, ta có thể tách N ra làm 3 nhóm với số lượng a, a, và b sao cho a b 2a. Lần đầu ta cân 2 nhóm a, nếu cân thăng bằng, ta có 2a đồng đều thật, và cân lần 2 với b đồng mỗi bên. Nếu cân lệch, ta biết b đồng còn lại là thật và ta sẽ cân tiếp a đồng từ b với một trong 2 nhóm a đã cân.
Cách làm này, còn thiếu cho trường hợp N D 5, vì với N D 5 ta không thể tách ra thành 3 nhóm như yêu cầu của cách giải trên. Với N D 5, lần đầu ta cân mỗi bên 2 đồng. Nếu cân thăng bằng, ta cân lần cuối với một đồng bất kỳ trong 4 đồng này và đồng còn lại. Nếu cân lệch, ta làm như lần cân thứ 2 cho trường hợp N D 4. Và như vậy bài toán đã được giải quyết.
4. Bài toán 10 đồng xu
Ở bài toán này, chúng tôi giới thiệu một bài toán khá khó, và được giải quyết từ cách đây gần 20 năm (1997) bởi một nhà toán học Việt Nam quen thuộc với Epsilon ở các số trước: Giáo sư Vũ Hà Văn (bạn đọc có thể xem chi tiết hơn ở [3]).
Chúng tôi phát biểu bài toán này ở dạng đơn giản với 10 đồng xu như sau:
Cho 10 đồng xu, trong đó có một số đồng giả. Biết rằng các đồng thật nặng bằng nhau. Các đồng giả cũng đôi một nặng bằng nhau nhưng có khối lượng khác với đồng thật. Với một cân đĩa và không sử dụng thêm quả cân, bằng 3 lần cân hãy cho biết 10 đồng này liệu có phải cùng loại?
73
Tạp chí Epsilon, Số 06, 12/2015
Phát biểu tổng quát hơn của bài toán này như sau:
Cho một tập gồm m đồng xu với tối đa 2 loại khối lượng khác nhau. Hãy xác định liệu tất cả các đồng này có cùng khối lượng bằng ít lần cân nhất.
Bạn đọc có thể tham khảo lời giải chi tiết hơn ở [3], trong mục này chúng tôi sử dụng lời giải sơ cấp và cụ thể trong trường hợp N D 10 này như sau:
Trước tiên, đánh số các đồng xu từ 1 đến 10. Dễ thấy, nếu như trong một lần cân bất kỳ, cân chênh lệch thì ta giải quyết được bài toán. Do vậy, giả sử rằng cân luôn cân bằng trong cả 3 lần cân.
Xét 2 nhóm: nhóm 1 chỉ gồm đồng 1, nhóm 2 gồm 2 đồng 2 và 3. Gọi a và b lần lượt là số đồng giả ở 2 nhóm này. Như vậy ta có a D 0 hoặc a D 1 và b D 0, hoặc b D 1, hoặc b D 2.
Lần 1: cân 3 đồng (1, 2, 3) và 3 đồng (4, 5, 6). Do cân cân bằng nên ta biết số đồng giả ở 3 đồng (4, 5, 6) là a + b.
Lần 2: cân 4 đồng còn lại (7, 8, 9, 10) và 4 đồng (1, 4, 5, 6). Do cân cân bằng nên ta biết số đồng giả ở 4 đồng (7, 8, 9, 10) này là 2a C b.
Lần 3: cân (1, 7, 8, 9, 10) và (2, 3, 4, 5, 6). Do cân cân bằng nên ta có 3a C b D a C 2b, suy ra 2a D b. Điều này nghĩa là hoặc a D b D 0 (nghĩa là tất cả các đồng đều thật) hoặc a D 1 và b D 2 (nghĩa là tất cả các đồng đều giả). Trong cả 2 tình huống, ta đều chỉ ra được tất cả các đồng này có cùng khối lượng với nhau hay không!
5. Bài toán 9 đồng xu
Chúng tôi bắt đầu và kết thúc cho chuyên mục này đều với các bài toán 9 đồng xu, 2 lần cân, và bài toán cuối cùng này như sau:
74
Tạp chí Epsilon, Số 06, 12/2015
Có 9 đồng xu, trên mỗi đồng có ghi các con số từ 1 đến 9 cho biết khối lượng tương ứng của chúng là 1gr, 2gr, . . . 9gr. Biết rằng có một đồng trong số này bị lỗi và có khối lượng nhẹ hơn khối lượng được quy định. Với một chiếc cân đĩa và không sử dụng thêm quả cân, liệu rằng với 2 lần cân, có thể chỉ ra đồng bị lỗi này?
Lời giải bài toán này khá đơn giản và chúng tôi xin dành cho độc giả. Chúng tôi cũng kết thúc chuyên mục tại đây và hẹn gặp lại trong số tới, với chuyên đề bài toán cân tiền với cân số.
Tài liệu tham khảo
[1] F. J. Dyson and R. C. Lyness, Math. Gazette, vol. 30, 1946.
[2] R. Bellman and B. Glass, “On various versions of the defective coin problem,” Information and Control, vol. 4, pp. 118–131, 1961.
[3] D. N. Kozlov, V. H. Vu, “Coins and Cones," Journal of Combinatorial Theory, Series A, vol. 78, no. 1, pp 1–14, 1997.
[4] B. D. Bundy, “The Oddball Problem,” Mathematical Spectrum, vol. 29, no. 1, pp 14–15, 1996/7.
[5] A. Bogomolny, “Odd Coin Problems: the 120 marble problem - five weigh ings from Interactive Mathematics Miscellany and Puzzles, ” www.cut-the knot.org//blue//OddCoinProblems.shtml, Accessed 09 October 2015.
75
Tạp chí Epsilon, Số 06, 12/2015
76
XUNG QUANH BÀI TOÁN HÌNH HỌC TRONG KỲ THI VMO 2014
Nguyễn Tiến Dũng - Hà Nội
Tóm tắt
Bài viết đưa ra một góc nhìn của tác giả về bài hình học số 4 trong kỳ VMO 2014 cũng như những khai thác xung quanh cấu hình của bài toán.
Bài hình học số 4 trong kỳ VMO 2014 có nội dung được đề cập trong [1] như sau:
Bài toán 1. Cho tam giác nhọn ABC nội tiếp đường tròn .O/ với AB < AC. Gọi I là trung điểm cung BC không chứa A. Trên AC lấy điểm K khác C sao cho IK D IC. Đường thẳng BK cắt .O/ tại D.D ¤ B/ và cắt đường thẳng AI tại E. Đường thẳng DI cắt đường thẳng AC tại F .
1. Chứng minh rằng EF DBC2.
2. Trên DI lấy điểm M sao cho CM song song với AD. Đường thẳng KM cắt đường thẳng BC tại N. Đường tròn ngoại tiếp tam giác BKN cắt .O/ tại P .P ¤ B/. Chứng minh rằng đường thẳng PK đi qua trung điểm của đoạn thẳng AD.
Có thể thấy rằng hai ý của bài toán hầu như không liên quan tới nhau, ý 2. mới là ý chính của bài toán. Vì vậy, đề bài được phát biểu gọn lại như sau
Bài toán 2. Cho tam giác nhọn ABC nội tiếp đường tròn .O/ với AB < AC. Gọi I là trung điểm cung BC không chứa A. Trên AC lấy điểm K khác C sao cho IK D IC. Đường thẳng BK cắt .O/ tại D.D ¤ B/. Trên DI lấy điểm M sao cho CM song song với AD. Đường thẳng KM cắt đường thẳng BC tại N. Đường tròn ngoại tiếp tam giác BKN cắt .O/ tại P .P ¤ B/. Chứng minh rằng đường thẳng PK đi qua trung điểm của đoạn thẳng AD.
Lời giải thứ nhất. Do I là trung điểm cung BC không chứa A của đường tròn .O/ nên IB D IC D IK. Ta thấy ∠AKI D 180ı ∠CKI D 180ı ∠ICK D ∠ABI nên AIB D AIK.g:c:g/. Vì thế K đối xứng với B qua AI . Ta có ∠DCK D ∠ABK D ∠AKB D ∠DKC nên dễ thấy DI là trung trực của đoạn CK. Chú ý đến tính đối xứng qua trục DI và CM k AD ta có ∠MKC D ∠MCK D ∠DAC D ∠KBN nên AC là tiếp tuyến của đường tròn .BKN /. Gọi E là giao của DI và AC, thế thì ∠EKP D ∠KBP D ∠EIP nên tứ giác EPIK nội tiếp, suy ra ∠IPK D ∠IEK D 90ı. PK cắt .O/ tại F .F ¤ P /. Chú ý rằng K là trực tâm của tam giác ADI nên ta dễ dàng chứng minh được AFDK là hình bình hành. Do đó
KF đi qua trung điểm AD. Từ đó ta có đpcm.
77
A
O
Tạp chí Epsilon, Số 06, 12/2015
F
D
K
E
M
B C
N
P
I
Lời giải thứ hai. Trong lời giải thứ nhất, ta đã chứng minh được AC là tiếp tuyến của đường tròn .BKN /. Từ đó, chú ý đến tính đối xứng qua AI , ta cũng có AB là tiếp tuyến của đường tròn .BKN /. Gọi L là giao của AP và đường tròn .BKN /.L ¤ P /. Vì∠KLP D ∠KBP D ∠DAP nên KL k AD. PK cắt AD tại S. Bằng biến đổi góc đơn giản, ta thu được các cặp tam giác đồng dạng SAK và KPL, SDK và BPL. Chú ý rằng tứ giác BPKL điều hòa ta có SKDKP
KLDBP
SA
BLDSD
SKnên SA D SD. Suy ra đpcm.
A
D
L
O
K
M
B C N
P
I
78
Tạp chí Epsilon, Số 06, 12/2015
Nhận xét.
1. Trong lời giải thứ nhất, ta có ∠KPN D ∠KBN D ∠DAC D ∠KIE D ∠KPE nên P; N; E thẳng hàng.
2. Việc phát biểu lại làm cho đề toán hay và có ý nghĩa hơn. Trên đây, tác giả đã trình bày hai lời giải thuần túy hình học cho bài toán. Lời giải thứ nhất là của tác giả. Lời giải thứ hai dựa trên ý tưởng sử dụng các kiến thức về tứ giác điều hòa và chùm điều hòa của thành viên diễn đàn Toán học Mathscope.org có nickname vinhhai (trong [3]), được tác giả chỉnh lí lại để có được lời giải thuần túy hình học. Chú ý rằng K là trực tâm của tam giác IAD, ta có thể phát biểu lại bài toán 2 như sau:
Bài toán 3. Cho tam giác ABC nội tiếp đường tròn .O/. Các đường cao hạ từ B và C theo thứ tự cắt .O/ tại D và E. Kẻ EF k BC.F 2 AB/. HF cắt DE tại K. Đường tròn .HKD/ cắt .O/ tại P .P ¤ D/. Chứng minh rằng PH chia đôi BC.
A
E F
P K
O D
H
B C
Từ nhận xét 1. trong bài toán 2 và bài toán 3, ta có thể đề xuất các bài toán sau:
Bài toán 4. Cho tam giác ABC nội tiếp đường tròn .O/, có trực tâm H. Các đường cao BD và CE theo thứ tự cắt .O/ tại F và G. Kẻ FM k GN k BC.M 2 AC; N 2 AB/. HM và HN theo thứ tự cắt F G tại K và L. Chứng minh rằng DK và EL cắt nhau tại một điểm thuộc .O/.
79
A
M
Tạp chí Epsilon, Số 06, 12/2015 F
P K L
D
G
N
E
H
O
B C
Lời giải. Dễ thấy tứ giác ADHE nội tiếp đường tròn đường kính AH. Gọi P là giao của đường tròn đường kính AH với .O/.P ¤ A/. Chú ý rằng AB là trung trực của GH và GN k BC ta có ∠HLF D ∠LGH C ∠LHG D ∠FBC C ∠NGH D ∠HBC C ∠HCB D ∠BAC D 90ı ∠ABF D ∠APH ∠APF D ∠HPF nên tứ giác HLPF nội tiếp. Từ đó, ta có ∠LPH D ∠LFH D ∠EAH D ∠EPH, vì thế P; E; L thẳng hàng. Chứng minh tương tự
P; D; K thẳng hàng. Do đó DK; EL cắt nhau tại điểm P thuộc .O/.
Bài toán 5. Cho tam giác ABC có các đường cao BD; CE cắt nhau tại H. Gọi F; G theo thứ tự là điểm đối xứng với H qua AC; AB. I là trung điểm F G. K; L theo thứ tự giao điểm khác I của đường tròn ngoại tiếp các tam giác HID; HIE với F G. DK; EL cắt nhau tại P. Chứng minh rằng PH chia đôi BC.
A
F
P K
L
G
H E
I
D
B C
Nếu nhìn nhận bài toán 5 dựa trên cấu hình của các bài toán 3 và 4 thì vấn đề trở nên rất đơn giản. Nhưng để có được một lời giải đẹp và trực tiếp cho bài toán thì không phải là điều dễ dàng. Tiếp tục khai thác, ta có bài toán sau:
80