🔙 Quay lại trang tải sách pdf ebook Tạp Chí Epsilon Số 10 Ebooks Nhóm Zalo Kĩ năng tự học là kĩ năng quan trọng nhất mà một người có thể sở hữu.” TONY BUZAN "Logic là cơ sở của hầu như toàn bộ kiến thức mà chúng ta thu nhận được. LEONARD EULER 08 09 10 07 06 05 11 12 VẬT LÝ, HÌNH HỌC VÀ TRÁI ĐẤT TRÒN Nguyễn Ái Việt SỐT MAYONNAISE VÀ BẦU CỬ TỔNG THỐNG MỸ Nils Berglund BÌNH LUẬN ĐỀ THI OLYMPIC TOÁN QUỐC TẾ 2016 Nguyễn Tiến Dũng BẤT ĐẲNG THỨC TAM GIÁC, ĐA GIÁC VÀ ĐA DIỆN Lê Tự Quốc Thắng VÀ CÁC CHUYÊN MỤC KHÁC CHỦ BIÊN: Trần Nam Dũng BIÊN TẬP VIÊN: Võ Quốc Bá Cẩn Ngô Quang Dương Trần Quang Hùng Nguyễn Văn Huyện Dương Đức Lâm Lê Phúc Lữ Nguyễn Tất Thu Đặng Nguyễn Đức Tiến 08 09 10 07 06 05 11 12 LỜI NGỎ Nắng tháng 8 vàng rực trên những con đường, mùa hè đã đến độ chín mùi. Những cuộc vui, những chuyến đi xa đang đúng dịp tưng bừng nhất. Nhưng đâu đó, vào độ tháng tám lưng chừng, vài cơn mưa chợt đi chợt đến, vài ngọn gió sớm mát lành đưa đến mùi vị một mùa thu tựu trường chẳng còn bao xa. Tạp chí Epsilon, ra mắt vào những tuần lễ cuối cùng của mùa hạ, cũng là số ra mắt lần thứ 10, một con số đẹp và trọn vẹn để mọi người cùng nhìn lại một chặng đường đã đi qua. Đối với những người trong ban biên tập, số 10, coi như đã tròm trèm một chu kỳ, và bắt đầu một chặng đường mới để phấn đấu. Chúng tôi cũng hy vọng rằng với bạn đọc, đặc biệt với những người gắn bó với bảng đen bục giảng, ít nhiều số 10 này cũng sẽ có ý nghĩa vào thời khắc giao mùa. Để khi tháng tám trôi qua, tháng 9 gõ cửa, chúng ta lại cùng bắt đầu một chặng mới trên con đường truy tầm tri thức mênh mông. Đi nhiều người, bạn sẽ đi rất xa ... MỤC LỤC Ngô Quang Hưng Bất đẳng thức không-Shannon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Lê Tự Quốc Thắng Bất đẳng thức tam giác, đa giác, và đa diện . . . . . . . . . . . . . . . . . . . . . . . . . 15 Nguyễn Hùng Sơn Toán học và nghệ thuật tung hứng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Đặng Minh Tuấn Hệ mật mã khóa công khai dựa trên đường cong Elliptic - Một số ứng dụng . . . . . . . 33 Nguyễn Ái Việt Vật lý, Hình học và Trái đất tròn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Nils Berglund, dịch giả: Dương Đức Lâm Sốt mayonnaise và bầu cử tổng thống Mỹ . . . . . . . . . . . . . . . . . . . . . . . . . 50 Dương Trọng Tấn Học cách học: Một bài học quan trọng bậc nhất đang bị bỏ quên . . . . . . . . . . . . . 61 Nguyễn Đức Hưng Leonhard Euler - Người thầy vĩ đại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Lý Ngọc Tuệ Giá trị nào cho 1 + 1 + 1 + ... ? Vô cùng hay -1/2? . . . . . . . . . . . . . . . . . . . . . 68 Trịnh Đào Chiến Tiếp nối câu chuyện về một tổng lũy thừa . . . . . . . . . . . . . . . . . . . . . . . . . 76 Trần Quang Hùng, Nguyễn Đức Bảo Về một đề toán hay trên tạp chí THTT . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Nguyễn Trần Hữu Thịnh Một bổ đề về phân giác . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Trần Minh Ngọc Các đường tròn có hai điểm chung trong tứ giác nội tiếp . . . . . . . . . . . . . . . . . . 120 Trần Minh Hiền Định lý Cauchy-Davenport và ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Lê Anh Dũng Sử dụng Modulo trong phương trình nghiệm nguyên và bài toán chia hết . . . . . . . . . 156 4 Tạp chí Epsilon, Số 10, 08/2016 Nguyễn Quốc Anh Chứng minh BĐT bằng phương pháp phân tích bình phương với sự trợ giúp của máy tính 174 Gary Antonick, dịch giả: Nguyễn Vũ Duy Linh Một vài điểm đặc biệt của phong trào Olympic toán của Mỹ . . . . . . . . . . . . . . . . 193 Nguyễn Tiến Dũng Bình luận đề thi Olympic Toán Quốc tế (IMO) 2016 . . . . . . . . . . . . . . . . . . . . 198 Trần Nam Dũng Bài toán hay - lời giải đẹp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Ban Biên tập Lời giải đề thi Toán quốc tế Formula of Unity - The Third Millennium (tiếp theo) . . . . 209 Ban Biên tập Các vấn đề cổ điển - hiện đại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 5 Tạp chí Epsilon, Số 10, 08/2016 BẤT ĐẲNG THỨC KHÔNG-SHANNON Ngô Quang Hưng LogicBlox TÓM TẮT Tiếp theo bài giới thiệu về entropy, các bất đẳng thức Shannon và vài ứng dụng trong Epsilon số 7, bài này giới thiệu một bất đẳng thức không-Shannon cùng với một số tính chất mà các bất đẳng thức mà hàm entropy phải thoả mãn. Trong hành trình nho nhỏ này, ta sẽ tình cờ gặp một mối quan hệ giữa lý thuyết số và lý thuyết thông tin, và giữa bất đẳng thức thông tin và quy hoạch tuyến tính. Trước hết, xin tóm tắt lại một số ký hiệu đã được giới thiệu và dùng trong bài trước [5]. Ta chỉ xét các phân bố xác suất trên n biến rời rạc X0, . . . , Xn, trên các miền χ1, . . . , χn tương ứng. Ta dùng XS = (Xi)i∈S để ký hiệu một bộ biến ngẫu nhiên có chỉ số trong tập S ⊆ [n], và xS = (xi)i∈S ∈Qi∈S χi để ký hiệu một bộ giá trị cụ thể của các biến này. Entropy của một phân bố cho ta một con số H[XS] với mỗi tập con ∅ 6= S ⊆ [n]. Do đó, ta viết H(S) thay vì H[XS]. Entropy của một phân bố cho trước là một hàm tập hợp H : 2[n] − {∅} → R+. Hàm entropy H cũng là một vector trên không gian R2n−1 + , tại vì có tất cả 2n − 1 tập con khác rỗng của [n], và mỗi tập con là một toạ độ. Với một phân bố khác thì ta lại có entropy khác, nghĩa là một hàm tập hợp khác và một vector khác trong không gian R2n−1 định lý sau đây: + . Bài trước đã chứng minh Định lý 0.1. Xét một phân bố xác suất liên kết của n biến tuỳ hỉ. Entropy H của phân bố này thoả ba tính chất sau đây: • Tính không âm: H(S) ≥ 0, ∀S ⊆ [n], S 6= ∅. • Tính đơn điệu: H(S) ≤ H(T), ∀S ⊆ T ⊆ [n]. • Tính sub-modular: H(S ∪ T) + H(S ∩ T) ≤ H(S) + H(T), ∀S, T ⊆ [n]. Nói cách khác, entropy H là một polymatroid. Tất cả các bất đẳng thức được thoả mãn bởi mọi polymatroid thì tất nhiên cũng được thoả mãn bởi mọi hàm entropy. Ta gọi chúng là các bất đẳng thức kiểu-Shannon. 6 Tạp chí Epsilon, Số 10, 08/2016 1. Bất đẳng thức Zhang-Yeung Trong hơn nửa thế kỷ, tất cả các bất đẳng thức entropy mà chúng ta biết thì đều là bất đẳng thức kiểu Shannon. Năm 1998, Zhang và Yeung [7] khám phá ra một bất đẳng thức không chứng minh được bằng các tính chất của polymatroid: 2I(C; D) ≤ I(A; B) + I(A; C, D) + 3I(C; D|A) + I(C; D|B). (1) Nhớ rằng thông tin tương hỗ là một hàm tuyến tính của entropy: I(X; Y ) = H(X) + H(Y ) − H(XY ), I(X; Y |Z) = H(XZ) + H(Y Z) − H(XY Z) − H(Z), cho nên bất đẳng thức (1) là một bất đẳng thức entropy. Bất đẳng thức này cho thấy sự tồn tại của một bất đẳng thức đúng với mọi entropy nhưng không đúng với mọi polymatroids. Làm thế nào mà Zhang-Yeung tìm ra và chứng minh được rằng 1. Bất đẳng thức (1) không suy ra được từ các tính chất của polymatroid? 2. Tất cả các hàm entropy đều phải thoả bất đẳng thức (1)? 1.1. Quy hoạch tuyến tính Ta đi đường vòng để trả lời câu hỏi đầu tiên. Nếu đi đường thẳng thì chỉ cần chỉ ra một polyma troid không thoả mãn bất đẳng thức (1) là xong. Một bất đẳng thức suy ra được từ các tính chất của polymatroids nếu và chỉ nếu nó được thoả mãn bởi tất cả các polymatroids. Nhưng nói vậy thì quá mù mờ, ta cần một phương pháp có hệ thống nào để kiểm tra xem một bất đẳng thức kiểu như H(AB) + H(AC) + H(BC) ≥ 2H(ABC) có được thoả mãn bởi tất cả các polymatroids (trên 3 biến) hay không. Nhớ rằng, như đã viết ở trên, một hàm tập hợp h : 2[n] → R+ cũng được xem như một vector h ∈ R2n−1 + (vì h(∅) = 0 trong ngữ cảnh của ta). Ta dùng các tập con không rỗng của [n] để đánh chỉ số các toạ độ của vector h. Một hàm tập hợp là một polymatroid nếu và chỉ nếu nó nằm trong đa diện P = {Mh ≥ 0, h ≥ 0}, trong đó M là ma trận của các tính chất đơn điệu và sub-modular ở trên. Ví dụ, với tính chất sub-modular trên tập S, T thì sẽ có một hàng của ma trận M tương ứng với bất đẳng thức h(S) + h(T) − h(S ∪ T) − h(S ∩ T) ≥ 0. Hàng này của ma trận M có hai số 1 ở các toạ độ S, T, và hai số −1 ở các toạ độ S ∪ T và S ∩ T. Một bất đằng thức tuyến tính sẽ có dạng cTh ≥ 0, trong đó c ∈ R2n−1là một vector hệ số. Ví dụ, trong bất đẳng thức h(AB) + h(AC) + h(BC) − 2h(ABC) ≥ 0 7 Tạp chí Epsilon, Số 10, 08/2016 thì vector c có ba số 1 ở các toạ độ AB, AC, BC, và một số −2 ở toạ độ ABC. Câu hỏi thứ nhất ở trên tương đương với câu hỏi: “làm thế nào để biết là cTh ≥ 0 đúng với mọi h ∈ P?” Lưu ý rằng vector 0 ∈ P, ta có cTh ≥ 0, ∀h ∈ P nếu và chỉ nếu min{cTh | Mh ≥ 0, h ≥ 0} = 0. Bài toán min{cTh | Mh ≥ 0, h ≥ 0} là một bài toán quy hoạch tuyến tính cơ bản. Và ta có thể giải nó (bằng máy tính) để kiểm tra xem bất đẳng thức cTh ≥ 0 có đúng với mọi polymatroids hay không. Một cách khác là ta dùng tính chất đối ngẫu của quy hoạch tuyến tính; tính chất này nói rằng min{cT x | Ax ≥ b, x ≥ 0} = max{bT y | AT y ≤ c, y ≥ 0}, nếu như một trong hai bài toán có hàm mục tiêu hữu hạn. Bài toán min{cTh | Mh ≥ 0, h ≥ 0} có quy hoạch đối ngẫu của nó viết là min{cTh | Mh ≥ 0, h ≥ 0} = max{0T y | MT y ≤ c, y ≥ 0}. Bài toán đối ngẫu có hàm mục tiêu hữu hạn (bằng 0) nếu và chỉ nếu nó có nghiệm! Như vậy, ta vừa chứng minh được bổ đề sau1: Bổ đề 1.1. Bất đẳng thức cTh ≥ 0 đúng với mọi polymatroid h nếu và chỉ nếu hệ bất phương trình sau đây có nghiệm: MT y ≤ c, y ≥ 0. Trong đó, M là ma trận của các bất đẳng thức sub-modularity và đơn điệu. Nói cách khác, bất đẳng thức cTh ≥ 0 đúng nếu mà chỉ nếu ta tìm được các hệ số y không âm và tổ hợp tuyến tính dùng các hệ số y của các bất đẳng thức sub-modularity và đơn điệu “suy ra” cTh ≥ 0 được. “Đối ngẫu trong quy hoạch tuyến tính” nghe có vẻ hơi vang vang, nhưng nó là một tính chất đơn giản; nếu hệ bất phương trình có nghiệm thì ta suy ra được rằng cTh ≥ (MT y)Th = yTMh ≥ yT 0 = 0. Tất nhiên, chứng minh trực tiếp chiều ngược lại của bổ đề trên mà không dùng quy hoạch tuyến tính thì khó hơn một chút; và làm việc này không cần thiết lắm trong ngữ cảnh của bài viết. Tóm lại, Bổ Đề 1.1 cho chúng ta một thuật toán để kiểm tra xem một bất đẳng thức kiểu (1) có phải là bất đằng thức Shannon hay không? Ta chỉ cần kiểm tra xem hệ bất phương trình tuyến tính tương ứng có nghiệm hay không; bất kỳ một LP-solver nào (như cplex, Gurobi) đều làm được điều này dễ dàng. 1.2. Lên không gian nhiều chiều hơn Bây giờ ta quay lại câu hỏi thứ hai: làm thế nào để chứng minh rằng (1) là một bất đẳng thức mà tất cả các hàm entropy trên 4 biến đều phải thoả? Đây thật sự là câu hỏi mấu chốt cần một phát kiến tuyệt vời của Zhang và Yeung. Đại khái, họ xây dựng một biến ngẫu nhiên thứ 5, gọi là R, và dùng một bất đẳng thức kiểu Shannon cho phân bố (A, B, C, D, R). Biến R có một tính chất 1Đây chẳng qua là một dạng của bổ đề Farkas 8 Tạp chí Epsilon, Số 10, 08/2016 đặc biệt, mà nhờ đó khi ta “chiếu” bất đẳng thức kiểu Shannon từ không gian (A, B, C, D, R) xuống không gian (A, B, C, D) thì ta có bất đẳng thức (1). Một cách nôm na hơn, gọi Γ∗nlà tập tất cả các hàm entropies H của n biến, và Γn là tập tất cả các hàm polymatroids của n biến. Định lý 0.1 cho ta biết Γ∗n ⊆ Γn. Ngoài ra, Γn là một tập lồi, và Γ∗n không phải là tập đóng, nhưng bao đóng của nó cũng là một tập lồi. Một bất đẳng thức như cTh ≥ 0, nếu đúng với mọi polymatroid, thì chẳng qua là vì cTh là một siêu phẳng nằm ngoài Γn; vector c là một pháp tuyến của siêu phẳng này. Một bất đẳng thức như (1) đúng với Γ∗n nhưng không đúng với Γn thì phải là một siêu phẳng nằm ngoài tập Γ∗n và cắt vào trong Γn. Ở trên ta đã chứng minh rằng cái siêu phẳng tương ứng với (1) cắt Γ4. Để chứng minh rằng nó nằm ngoài Γ∗4, ta tìm một siêu phẳng nằm ngoài Γ5 sao cho “hình chiếu” của nó xuống không gian (A, B, C, D) chính là siêu phẳng tương ứng với (1). Cụ thể hơn, ta ghị lại toàn bộ phương pháp của Zhang-Yeung dùng một chứng minh mới hơn [2]. Bổ đề 1.2. Gọi A, B, C, D là bốn biến từ một phân bố liên kết nào đó. Thì, tồn tại một biến ngẫu nhiên R phân bố liên kết với A, B, C, D, với các tính chất như sau: (i) Phân bố ngoại vi của (A, B, C) và (A, B, R) giống hệt nhau (với C thay bằng R) (ii) I(CD; R|AB) = 0. Tóm tắt. Gọi p(a, b, c, d) là hàm cân nặng xác suất của phân bố liên kết của (A, B, C, D). Gọi R là một biến ngẫu nhiên mới có cùng miền với C, và định nghĩa hàm cân nặng xác suất p0(a, b, c, d, r) = p(a, b, c, d)Pdp(a, b, r, d) P c,d p(a, b, c, d). Dễ thấy rằng Prp0(a, b, c, d, r) = p(a, b, c, d): nghĩa là phân bố ngoại vi trên (A, B, C, D) của p0chính là phân bố cũ của (A, B, C, D). Và từ đó ta cũng có p0là một hàm cân nặng xác suất (tổng bằng 1). Từ đây, kết thúc chứng minh bổ đề chỉ còn là cơ bắp. Ta viết lại bất đẳng thức (1) một chút. Trước hết, chuyển I(C; D) sang vế phải và sắp xếp lại, dễ thấy bất đẳng thức (1) tương đương với bất đẳng thức sau đây: I(C; D) ≤ I(A; B) + 2I(C; D|A) + I(C; D|B) + I(A; C, D) + I(C; D|A) − I(C; D) = I(A; B) + 2I(C; D|A) + I(C; D|B) + H(A) + H(CD) − H(ACD) +H(AC) + H(AD) − H(ACD) − H(A) − H(C) − H(D) + H(CD) = I(A; B) + 2I(C; D|A) + I(C; D|B) +H(CD) + H(AC) − H(ACD) − H(D) + H(AD) + H(CD) − H(ACD) − H(C) = I(A; B) + 2I(C; D|A) + I(C; D|B) + I(A; D|C) + I(A; C|D). Sau đó, đổi biến A ↔ C và B ↔ D thì ta có (1) tương đương với (2) dưới đây. 9 Tạp chí Epsilon, Số 10, 08/2016 Định lý 1.3 (Zhang-Yeung). Gọi A, B, C, D là các biến ngẫu nhiên từ một phân bố liên kết bất kỳ, thì I(A; B) ≤ 2I(A; B|C) + I(A; C|B) + I(B; C|A) + I(A; B|D) + I(C; D). (2) Chứng minh. Gọi R là biến ngẫu nhiên từ Bổ Đề 1.2. Lưu ý rằng thông tin tương hỗ (giữa hai biến) và thông tin tương hỗ có điều kiện là các đại lượng không âm. Ta có I(A; B) ≤ I(A; B) +I(C; R|A) + I(C; D|R) + I(AB; R|CD) + I(D; R|B) +I(A; B|RD) + I(D; R|A) + I(R; C|B) + I(A; B|CR) + I(C; R|ABD) = 2I(A; B|C) + I(A; C|B) + I(B; C|A) + I(A; B|D) + I(C; D) (= 0) +2I(CD; R|AB) (= 0) +I(A; B|R) − I(A; B|C) (= 0) +I(A; R|B) − I(A; C|B) (= 0) +I(B; R|A) − I(B; C|A). 2. Bất đẳng thức thông tin và bất đẳng thức nhóm Định nghĩa 2.1 (Bất đẳng thức thông tin). Nếu bất đẳng thức cTh ≥ 0, đúng với mọi h ∈ Γ∗nthì nó gọi là một bất đẳng thức thông tin. Do tất cả các hàm entropy đều là polymatroid, tất cả các bất đẳng thức Shannon đều là các bất đẳng thức thông tin. Ngược lại, có một số vô hạn [4] các bất đẳng thức thông tin không phải là bất đẳng thức Shannon. Ví dụ cụ thể là bất đẳng thức (1). Bổ Đề 1.1 đã cho ta biết cách (bằng một thuật toán) kiểm tra xem một bất đẳng thức có phải là bất đẳng thức Shannon hay không. Từ đó nảy ra câu hỏi rất tự nhiên là: có kết quả nào cho chúng ta một thuật toán xác minh một bất đẳng thức thông tin không? Tiếc rằng cho đến nay chưa có kết quả nào như vậy. Tuy nhiên, có một kết quả thú vị của Chan và Yeung [1] liên kết bất đẳng thức thông tin và cái gọi là “bất đẳng thức nhóm”. Định nghĩa 2.2 (Hàm đặc tính nhóm). Gọi h : 2[n] − {∅} → R+ là một hàm tập hợp. Hàm này được gọi là hàm đặc tính nhóm2 nếu tồn tại một nhóm hữu hạn G, và n nhóm con G1, . . . , Gn, sao cho h(S) = log2|G| |GS|, ∀S ⊆ [n], S 6= ∅. Trong đó, GS =Ti∈S Gilà một nhóm con của G. Gọi Υn là tập tất cả các hàm đặc tính nhóm vừa định nghĩa. 2Group-characterizable function 10 Tạp chí Epsilon, Số 10, 08/2016 Định nghĩa 2.3 (Bất đẳng thức nhóm). Nếu bất đẳng thức cTh ≥ 0 đúng với mọi h ∈ Υn, thì nó được gọi là một bất đẳng thức nhóm. Cụ thể hơn, một bất đẳng thức nhóm là bất đẳng thức có dạngX ∅6=S⊆[n] c(S) · log2|G| |GS|≥ 0, (3) sao cho nó đúng với mọi nhóm hữu hạn G và n nhóm con G1, . . . , Gn. (Nhớ rằng GS = T i∈S Gi.) Ta đã gặp nhiều bất đẳng thức thông tin [5], nhưng chưa gặp bất đẳng thức nhóm nào. Đòi hỏi (3) đúng với mọi nhóm hữu hạn và n nhóm con có vẻ rất mạnh. Có tồn tại bất đẳng thức nhóm nào hay không? Trước hết ta xét một ví dụ đơn giản: Ví dụ 2.4. Gọi G là một nhóm hữu hạn bất kỳ, và G1, G2 là hai nhóm con. Ta có log2|G| |G1|+ log2|G| |G2|− log2|G| |G1 ∩ G2|≥ 0. Để chứng minh bất đẳng thức này, ta viết nó ở dạng khác: |G| · |G1 ∩ G2| ≥ |G1| · |G2|. Định nghĩa G1 ◦ G2 = {a ◦ b | a ∈ G1, b ∈ G2}3, thì ta có thể chứng minh |G1| · |G2| = |G1 × G2| = |G1 ◦ G2| · |G1 ∩ G2| ≤ |G| · |G1 ∩ G2|. Bài tập 2.5. Chứng minh rằng |G1 × G2| = |G1 ◦ G2| · |G1 ∩ G2|, với mọi nhóm con G1, G2 của một nhóm G hữu hạn. Kết quả rất đẹp của Chan và Yeung [1] là định lý sau đây: Định lý 2.6. Bất đẳng thức cTh ≥ 0 là bất đẳng thức thông tin nếu và chỉ nếu nó là bất đẳng thức nhóm. Chứng minh. Trước khi chứng minh, ta thảo luận một chút về kết quả này. Thoạt nhìn, nó hơi có vẻ lừa đảo vì nó chỉ chuyển từ một câu hỏi khó về lý thuyết thông tin sang một câu hỏi khó trong lý thuyết nhóm. Nó không cho chúng ta thông tin gì về phương pháp để xác minh xem một bất đẳng thức có phải là bất đẳng thức thông tin hay bất đẳng thức nhóm hay không. Mặt khác, liên hệ này lại rất thú vị. Để chứng minh một bất đẳng thức nhóm mới, ta chỉ cần chứng minh bất đẳng thức thông tin mới mà không cần biết gì về lý thuyết nhóm. Quyển sách của Yeung [6] có một vài ví dụ bất đẳng thức nhóm mới chứng minh được bằng lý thuyết thông tin mà trước đó các nhà đại số chưa biết. Ngược lại, nhờ định lý này mà các nhà lý thuyết thông tin có thể “cầu cứu” các nhà đại số, nhờ họ chứng minh hộ bất đẳng thức cho mình. Bây giờ ta chứng minh định lý. Gọi Γ¯∗nlà bao đóng của tập Γ∗n, và conv(Υn) là bao đóng lồi của tập Υn. Ta quan sát rằng • Bất đẳng thức cTh ≥ 0 là bất đẳng thức thông tin nếu và chỉ nếu Γ∗n ⊆ h ∈ R2n−1| cTh ≥ 0 . Do tập {h ∈ R2n−1| cTh ≥ 0} là tập đóng và lồi, điều này tương đương với Γ¯∗n ⊆ h ∈ R2n−1| cTh ≥ 0 . (4) 3G1 ◦ G2 không nhất thiết là nhóm con của G. 11 Tạp chí Epsilon, Số 10, 08/2016 • Tương tự như vậy, bất đẳng thức cTh ≥ 0 là bất đẳng thức nhóm nếu và chỉ nếu conv(Υn) ⊆ h ∈ R2n−1| cTh ≥ 0 . (5) Để chứng minh rằng (4) tương đương với (5), ta chứng minh Γ¯∗n = conv(Υn) bằng hai bước. Bổ đề 2.7 chứng minh rằng Υn ⊆ Γ∗n; do đó conv(Υn) ⊆ Γ¯∗n vì Γ¯∗nlà một hình nón lồi [6]. Bổ đề 2.8 chứng minh chiều ngược lại Γ¯∗n ⊆ conv(Υn). Bổ đề 2.7. Ta có Υn ⊆ Γ∗n, nghĩa là mọi hàm đặc tính nhóm đều là hàm entropy Chứng minh. Gọi h ∈ Υn là một hàm đặc tính nhóm, và G là một nhóm hữu hạn với các nhóm con G1, . . . , Gn sao cho h(S) = log2|G| GSvới mọi ∅ 6= S ⊆ [n]. Xét không gian xác suất Ω = G với phân bố đều p(g) = 1|G|với mọi g ∈ G. Với mọi i ∈ [n], định nghĩa biến ngẫu nhiên Xi: Ω → 2G như sau Xi(g) = gGi – là lớp trái4của nhóm Gi. Với một tập S ⊆ [n] và bộ (gi)i∈S bất kỳ, dễ thấy Prob g∈Ω Xi = giGi, ∀i ∈ S = Prob g∈Ω = Prob g∈Ω gGi = giGi, ∀i ∈ S g ∈ giGi, ∀i ∈ S =|Ti∈SgiGi| |G|. Nếu Ti∈SgiGi 6= ∅, lấy một phần tử a ∈Ti∈SgiGituỳ ý, thì ta có \ i∈S giGi =\ i∈S aGi = a\ i∈S Gi = aGS. Vậy thì Ti∈SgiGi hoặc là tập rỗng hoặc có kích thước bằng đúng |GS|. Hơn nữa, có tổng cộng |G|/|GS| tập không rỗng như thế. Do đó, |Ti∈SgiGi| |G|= (|GS| |G|nếu Ti∈SgiGi 6= ∅ 0 nếu Ti∈SgiGi = ∅. Từ đó, dễ thấy H[XS] = log2(|G|/|GS|) và h ∈ Γ∗n. Bổ đề 2.8. Ta có Γ¯∗n ⊆ conv(Υn), với mọi n ≥ 1. Chứng minh. Ta theo trình bày của Lun [3]. Gọi h ∈ Γ∗nlà một hàm entropy tuỳ ý, nghĩa là có n biến ngẫu nhiên X1, . . . , Xn sao cho H(S) = h(S). Để đơn giản, ta giả sử là miền χi của biến Xilà miền hữu hạn, và cụ thể hơn là các xác suất đều là số hữu tỉ. (Trong trường hợp tổng quát, ta dùng một chuỗi số hữu tỉ tiến đến số vô tỉ.) Ta chứng minh rằng tồn tại một chuỗi f(r) ∈ Υn sao cho limr→∞ f(r)/r = h. Gọi q là mẫu số chung của các xác suất Prob X[n] = x[n] . Chọn r = q, 2q, 3q, . . . là một bội số của q, và A là một ma trận n×r sao cho mỗi cột x[n] của A xuất hiện đúng r·Prob X[n] = x[n] lần. 4Left coset 12 Tạp chí Epsilon, Số 10, 08/2016 Với ∅ 6= S ⊆ [n], gọi AS là ma trận con của A xây dựng bằng cách lấy các hàng số i của A với i ∈ S. Dễ thấy rằng, một cột xS xuất hiện trong AS đúng r · Prob XS = xS lần. Gọi G = Sr là nhóm hoán vị của các cột của A. Gọi Gilà nhóm các hoán vị các cột của A sao cho hàng thứ i của A không thay đổi. Vậy thì GS là nhóm các hoán vị làm cho ma trận AS không đổi. Dễ thấy rằng (r · Prob XS = xS )! Dùng xấp xỉ Stirling, ta có limr→∞1rlog2|G| |GS| |GS| =Y xS∈Qi∈S χi = limr→∞1rlog2r! Q xS(r · Prob XS = xS )! = limr→∞1r r log2r −X xS r · Prob XS = xS log2r · Prob XS = xS + O(log2r)! = limr→∞ log2r −X xS Prob XS = xS log2r · Prob XS = xS ! = limr→∞ −X xS Prob XS = xS log2 Prob XS = xS ! = −X xS Prob XS = xS log2 Prob XS = xS = H[XS] = h(S). Định nghĩa f(r) = log2|G| |GS|thì ta có limr→∞ f(r)/r = h. Tài liệu [1] CHAN, T. H., AND YEUNG, R. W. On a relation between information inequalities and group theory. IEEE Trans. Information Theory 48, 7 (2002), 1992–1995. [2] DOUGHERTY, R., FREILING, C. F., AND ZEGER, K. Non-shannon information inequalities in four random variables. CoRR abs/1104.3602 (2011). [3] LUN, D. S. A relationship between information inequalities and group theory, 2002. [4] MATUS, F. Infinitely many information inequalities. In 2007 IEEE International Sympo sium on Information Theory (June 2007), pp. 41–44. 13 Tạp chí Epsilon, Số 10, 08/2016 [5] NGÔ QUANG HƯNG. Bất đẳng thức kiểu Shannon và vài ứng dụng. Epsilon, 7 (Feb 2016). [6] YEUNG, R. W. A first course in information theory. Information Technology: Transmission, Processing and Storage. Kluwer Academic/Plenum Publishers, New York, 2002. With a foreword by Toby Berger, With 1 CD-ROM. [7] ZHANG, Z., AND YEUNG, R. W. On characterization of entropy function via information inequalities. IEEE Trans. Inform. Theory 44, 4 (1998), 1440–1452. 14 Tạp chí Epsilon, Số 10, 08/2016 BẤT ĐẲNG THỨC TAM GIÁC, ĐA GIÁC VÀ ĐA DIỆN Lê Tự Quốc Thắng (School of Mathematics, Georgia Institute of Technology, Atlanta) 1. Bất đẳng thức tam giác, đa giác, và đa diện 1.1. Không gian chuẩn d chiều Ký hiệu R là tập hợp số thực, và R+ là tập hợp các số thực dương. Xét không gian chuẩn d chiều Rd với tích vô hướng hx, yi =Xd i=1 xiyi, cho x = (x1, . . . , xd), y = (y1, . . . , yd). Khi d = 2 đây là mặt phẳng, và d = 3 là không gian 3 chiều. Một điểm x ∈ Rd đôi khi được gọi là một vector. Định nghĩa chuẩn của một vector kxk =phx, xi, và khoảng cách giữa 2 vector x, y, hoặc còn gọi là chiều dài đoạn [x, y], là kx − yk. Một vector được gọi là vector đơn vị nếu nó có chuẩn bằng 1. Với khái niệm độ dài này, ta có thể định nghĩa diện tích của một đa giác trong R3cũng như thể tích của một đa diện trong R3. Hai vector x, y là song song nếu tồn tại một số thực k sao cho x = ky hoặc y = kx. Nếu U ⊂ Rd, a ∈ Rd, và k ∈ R, ta dịnh nghĩa a + U = {a + x | x ∈ U} kU = {kx | x ∈ U}. 1.2. Bất đẳng thức tam giác Như thông thường, ta đồng nhất chiều dài một cạnh của đa giác với chính cạnh ấy. Mệnh đề 1.1. Trong một tam giác, mỗi cạnh nhỏ hơn tổng của hai cạnh còn lại. 15 Tạp chí Epsilon, Số 10, 08/2016 Dùng ký hiệu vector, bất đẳng thức tam giác thường được phát biểu dưới dạng: Nếu x, y ∈ Rd không song song với nhau, ta có kx + yk < |xk + yk. Bất đẳng thức tam giác có thể chứng minh khá dễ dàng, trực tiếp từ định nghĩa khoảng cách, bằng cách sử dụng bất đẳng thức Cauchy về giá trị trung bình. Bất đẳng thức tam giác là một bất đẳng thức rất căn bản trong toán học. Nó là nền tảng của nhiều ngành toán học. Nó thể hiện nguyên lý đường thẳng là đường cực tiểu. Ta cũng có phần đảo của mệnh đề về bất đẳng thức tam giác như sau, mà các học sinh cấp 2 đều biết qua phương pháp dựng hình. Mệnh đề 1.2. Nếu 3 số dương thỏa mãn tính chất mỗi số nhỏ hơn tổng của 2 số còn lại thì chúng là cạnh của một tam giác duy nhất, tùy theo các đẳng cự (isometry) của không gian. 1.3. Bất đẳng thức đa giác Bất đẳng thức tam giác có thể dễ dàng tổng quát hoá cho đa giác. Mệnh đề 1.3. (a) Trong một đa giác, mỗi cạnh nhỏ hơn tổng của các cạnh còn lại. (b) Ngược lại, nếu n ≥ 3 số dương thoả mãn điều kiện mỗi số nhỏ hơn tổng các số còn lại thì chúng là cạnh của một đa giác lồi nào đó. Bài tập 1.1. (a) Chứng minh mệnh đề trên. (b) Chứng minh rằng nếu n > 3 thì ta không có tính duy nhất trong phần (b) của mệnh đề trên. 1.4. Bất đẳng thức đa diện Thay vì xét tam giác, đa giác là các vật thể 2 chiều, ta hãy xét đa diện là các vật thể 3 chiều. Định lý 1.4 (Bất đẳng thức đa diện). (a) Trong một đa diện, diện tích của một mặt nhỏ hơn tổng diện tích các mặt còn lại. (b) Ngược lại, nếu n ≥ 4 số dương thoả mãn điều kiện mỗi số nhỏ hơn tổng các số còn lại thì chúng là diện tích của các mặt của một đa diện lồi nào đó. Bài tập 1.2. Chứng minh phần (a) của định lý trên. (Gợi ý: Giả sử F là một mặt của đa giác. Hay chiếu trực giao các mặt khác xuống mặt phẳng chứa F.) Phần (b) của định lý trên khó hơn phần (a) nhiều. Ở mục sau chúng ta sẽ đưa ra một chứng minh đơn giản dựa vào định lý Minkowski về đa diện, một định lý rất hay trong hình học không gian nhưng ít được biết đến. Đến đây độc giả có thể đoán rằng định lý trên có thể tổng quát hoá cho không gian nhiều chiều. 16 Tạp chí Epsilon, Số 10, 08/2016 2. Định lý Minkowksi 2.1. Trường hợp 2 chiều Giả sử P là một đa giác. Nếu F là một cạnh của P, ký hiệu A(F) là độ dài của F, và định nghĩa vector pháp tuyến của F, ký hiệu u(F), là vector đơn vị vuông góc với F va hướng ra ngoài đa giác P. Định lý 2.1 (Định lý Minkowski 2 chiều). (a) Giả sử P là một đa giác lồi với các cạnh F1, . . . , Fn. Khi đó các vector u(F1), . . . , u(Fn) không cùng nằm trên môt đường thẳng, và Xn i=1 A(Fi)u(Fi) = −→0 . (b) Ngược lại: Giả sử các vector đơn vị khác nhau u1, . . . , un trong R2và các số dương a1, . . . an thỏa mãn điều kiện • u1, . . . , un không cùng nằm trên một đường thẳng, •Pni=1 aiui =−→0 . Khi đó tồn tại duy nhất một đa giác lồi P với các cạnh F1, . . . , Fn sao cho ai = A(Fi), ui = u(Fi) với mọi i = 1, . . . , n. Định lý này không khó chứng minh lắm, và ta sẽ chứng minh nó trong mục 3. 2.2. Trường hợp 3 chiều Định ly Minkowski trong trường hợp nhiều chiều hoàn toàn tương tự. Giả sử P là một đa diện lồi. Nếu F là một mặt của P, ký hiệu A(F) là diện tích của mặt F, và định nghĩa vector pháp tuyến của F, ký hiệu u(F), là vector đơn vị vuông góc với F và hướng ra ngoài. Định lý 2.2 (Định lý Minkowski 3 chiều). (a) Giả sử P là một đa diện lồi với các mặt F1, . . . , Fn. Khi đó các vector u(F1), . . . , u(Fn) không cùng nằm trên một mặt phẳng, và Xn i=1 A(Fi)u(Fi) = −→0 . (1) (b) Ngược lại: Giả sử các vector đơn vị khác nhau u1, . . . , un trong R3và các số dương a1, . . . an thoả mãn điều kiện • các vector u1, . . . , un không cùng nằm trên một mặt phẳng, và 17 Tạp chí Epsilon, Số 10, 08/2016 •Pni=1 aiui =−→0 . Khi đó tồn tại duy nhất một đa giác lồi P với các mặt F1, . . . , Fn sao cho ai = A(Fi), ui = u(Fi) với mọi i = 1, . . . , n. Chú ý 2.3. Định lý Minkowksi đúng trong không gian nhiều chiều. Phần (a) của định lý trên không khó lắm, và sẽ được chứng minh trong mục 3. Phần (b) khó hơn nhiều và là phần thú vị nhất của định lý. Tính duy nhất của phần (b) làm định lý là một kết quả rất hay. Nếu các vector u1, . . . , un và các số dương a1, . . . an thoả mãn điều kiện của phần (b) trong định lý, ta không dễ xác định số cạnh của các mặt của đa giác P! Định lý Minkowksi có nhiều ưng dụng trong toán hiện đại. Chúng ta sẽ thảo luận các chứng minh của định lý Minkowski trong các mục sau. Trước hết chúng ta sẽ chứng minh phần (b) của Định Lý 1.4 (định ly bất đẳng thức đa diện) bằng cách sử dụng định lý Minkowski. 2.3. Chứng minh định lý 1.4 (bất đẳng thức đa diện) Chứng minh. (a) Chứng minh phần (a) được đưa ra trong bài tập 1.2. Phần (a) cũng dễ dàng suy ra từ định lý Minkowski như sau. Từ (1), ta có A(F1)u(F1) = − Xn i=2 A(Fi)u(Fi) ! . Các vector u(F2), . . . , u(Fn) không cùng nằm trên một đường thẳng (vì nếu không thì tất cả u(F1), . . . , u(Fn) sẽ nằm trên một mặt phẳng). Tư bất đẳng thức tam giác ta có A(F1) 2, ta có Xn i=1 x0i =−→0 . Các vector x01, . . . , x0n không cùng nằm trên một mặt phẳng. Theo định lý Minkowski, tồn tại một đa diện lồi P sao cho |x0i| = ailà diện tích của các mặt của đa diện lồi này. 18 Tạp chí Epsilon, Số 10, 08/2016 Bài tập 2.1. (a) Hãy tìm hiểu điều kiện n ≥ 4 được sử dụng như thế nào trong chứng minh trên. (b) Hãy chứng minh rằng nếu n ≥ 4 số thực dương thoả mãn mỗi một số nhỏ hơn tổng các số còn lại thì tồn tại vô hạn đa giác lồi mà diện tích các mặt là các số đã cho. 3. Chứng minh định lý Minkowski, phần I Mặc dù là một định lý với phát biểu sơ cấp, các chứng minh được biết đến của phần (b) định lý Minkowski 3 chiều đều dùng đến công cụ toán cao cấp. Định lý Minkowski 2 chiều và phần (a) của định lý Minkowski 3 chiều có thể dễ dàng chứng minh bằng phương sơ cấp, và chúng ta sẽ thảo luận các chứng minh trong mục này. 3.1. Định lý Minkowski 2 chiều, phần (a) Chứng minh 1. Giả sử các đỉnh của P theo chiều kim đồng hồ là p1, . . . , pn. Ta có thể giả sử Fi là cạnh pipi+1. Đặt vi =−−−→ pipi+1. Ta có Xn i=1 vi =−→0 . Đặt τ là phép quay 90o ngược chiều kim đồng hồ. Ta có τ (vi) = A(Fi)ui. Vì vậy nếu các vector u(Fi) nằm trên một đường thẳng thì đa giác P sẽ nằm trên một đường thẳng là điều không thể xảy ra. Ta có Xn i=1 A(Fi)ui = τ Xn i=1 vi ! =−→0 . Chứng minh 2. Mặc dù chứng minh này dài hơn, nhưng nó sẽ dễ dàng tổng quát hoá cho trường hợp nhiều chiều. Ý tưởng chính là nếu chiếu P lên một đường thẳng, thì ảnh của nó được phủ 2 lần bởi các điểm trên chu vi của P, một lần từ hướng trên xuống và một lần từ hướng dưới lên. Giả sử v là một vector đơn vị bất kỳ. Ký hiệu v⊥ đường thẳng vuông góc với v đi qua góc toạ độ, và prvlà phép chiếu trực giao lên v⊥. Khi đó X = prv(P) là một đoạn thẳng. Đặt X˚ = X \ pr(V ), với V là tập hợp các đỉnh của P. Dễ dàng thấy chiều dài của prv(Fi) được tính bởi kprv(Fi)k = A(Fi)|hu(F), ui|. (2) Đặt F+ =[ hu(Fi),vi>0 Fi, F− =[ hu(Fi),vi<0 Fi. Mệnh đề. Với mỗi x ∈ X˚, tồn tại duy nhất x+ ∈ F+ và duy nhất x− ∈ F− sao cho prv(x+) = x = prv(x−). 19 Theo mệnh đề trên, ta có X kprv(Fi)k = kprv(P)k =X Tạp chí Epsilon, Số 10, 08/2016 kprv(Fi)k. (3) Từ (2) và (3), ta có hu(Fi),vi>0 hu(Fi),vi<0 hX i A(Fi)u(Fi), vi =X hu(Fi),vi>0 A(Fi)hu(Fi), vi +X hu(Fi),vi<0 A(Fi)hu(Fi), vi = kprv(P)k − kprv(P)k = 0. Vì v là vector đơn vị bất kỳ, ta có thể kết luận Pi A(Fi)u(Fi) = −→0 . Bài tập 3.1. Chứng minh mệnh đề được sử dụng trong chứng minh trên. (Gợi ý: Giả sử đường thẳng (prv)−1(x) cắt P theo đoạn thẳng x−x+, với vector −−−→ x−x+ cùng phương với v. Giả sử x− ∈ Fi. Vector từ x− hướng đến x+ là môt vector hướng vào trong đa giác P. Vì vậy h−−−→ x−x+, uii < 0.) Bài tập 3.2. Giả sử P la đa giác lồi, với các đỉnh p1, . . . , vn theo chiều kim đồng hồ và cạnh Fi = pipi+1. Chứng minh rằng trên đường tròn đơn vị, theo chiều kim đồng hồ bắt đầu từ u1, ta sẽ lần lượt gặp u2 . . . , un. 3.2. Định lý Minkowski 2 chiều phần (b) Chứng minh. Đánh số lại các vector u1, . . . , un sao cho nếu đi trên đường trơn đơn vị theo chiều kim đồng hồ bắt đầu từ u1, ta sẽ lần lượt gặp u2 . . . , un. Giả sử vilà ảnh của ui dưới phép quay 90ocùng chiều kim đồng hồ. Chọn điểm p1 bất kỳ. Lần lượt dựng các điểm p2, p3, . . . , pn sao cho −−−→ pipi+1 = aivi voi i = 1, . . . , n − 1. Vì Pni=1 aivi =−→0 , ta cũng có anvn =−−→pnp1. Đa giác P với các đỉnh p1, . . . , pn là đã giác thoả mãn các điệu kết luận của phần (b). Bài tập 3.3. Chứng minh tính duy nhất của phần (b) định lý Minkowski 2 chiều. Chú ý 3.1. Ta có thể thấy là chứng minh này không thể mở rộng lên cho trường hợp 3 chiều. Khác với trường hợp 2 chiều, trong trường hợp 3 chiều, bản chất của một mặt và bản chất của vector pháp tuyến của nó hoàn toàn khác nhau. 3.3. Định lý Minkowski 3 chiều, phần (a) Phần (a) khá đơn giản. 20 Tạp chí Epsilon, Số 10, 08/2016 Chứng minh. Giả sử v là một vector đơn vị bất kỳ. Ký hiệu v⊥ mặt phẳng vuông góc với v đi qua gốc toạ độ, và prvlà phép chiếu trực giao lên v⊥. Khi đó X = prv(P) là một đa giác lồi. Đặt X˚ = X \ pr(E), với E là hợp của các cạnh của P. Dễ dàng thấy rằng diện tích của prv(Fi) được tính bởi A(prv(Fi)) = A(Fi)|hu(F), ui|. Lý luận tương tự như trường hợp 2 chiều, ta có A(prv(Fi)). Và từ đó, X hu(Fi),vi>0 A(prv(Fi)) = A(prv(P)) = X hu(Fi),vi<0 hX i A(Fi)u(Fi), vi =X hu(Fi),vi>0 A(Fi)hu(Fi), vi +X hu(Fi),vi<0 A(Fi)hu(Fi), vi = A(prv(P)) − A(prv(P)) = 0. Vì v là vector đơn vị bất kỳ, ta có thể kết luận Pi A(Fi)u(Fi) = −→0 . Phần (a) cũng có một chứng minh “vật lý" như sau (từ blog của GS Đàm Thanh Sơn). Mặc dù không được chặt chẽ về mặt toán học, nhưng chứng minh này cũng chỉ ra một số ý tưởng thú vị. Ta hãy nhúng đa diện P vào một chất lỏng đồng nhất. Áp lực của chất lỏng lên mỗi mặt Fi bằng kA(Fi)u(Fi), với k là một hằng số khác 0 không phụ thuộc i. Vì P sẽ đứng bất động trong chất lỏng (điều này không giải thích toán học được), tổng tất các lực áp lên nó phải bằng ~0. Vì vậy P i A(Fi)u(Fi) = −→0 . 4. Chứng minh định lý Minkowski, phần II Phần (b) là phần hay nhất trong định lý Minkowski. Các chứng minh phần (b) của định lý Minkowski với số chiều ≥ 3 đều sử dụng toán cao cấp. Có lẽ chính vì vậy mà mặc dù được phát biểu dưới dạng sơ cấp, định lý Minkowski ít được biết đến trong toán sơ cấp. Ở đây ta chỉ chứng minh định lý Minkowski cho trường hợp n = 4, trường hợp này chỉ cần sử dụng kiến thức của toán phổ thông. Với một ít kiến thức về giải tích nhiều biến, bạn có thể hiểu được chứng minh định lý Minskowski tổng quát, xem mục 4.4. 4.1. Tập hợp các đa giác có vector pháp tuyến cho trước Giả sử u1, u2, u3, u4 ∈ R3 và các số dương a1, a2, a3, a4 thoả mãn các điều kiện của phần (b) định lý Minkowski 3 chiều. Từ giả thiết, ta có thể thấy rằng u2, u3, u4 không cùng trên một mặt phẳng. (4) Bài tập 4.1. Hãy chứng minh rằng u2, u3, u4 là độc lập tuyến tính, tức là nếu các số thực k2, k3, k4 thỏa k2u2 + k3u3 + k3u4 = ~0 thì k1 = k2 = k3 = 0. 21 Giả sử P là một đã diễn thoa điều kiện Tạp chí Epsilon, Số 10, 08/2016 các vector pháp tuyến mặt của P là u1, . . . , u4. (5) Khi đó tồn tại các số thực z1, z2, z3, z4 sao cho P = {x ∈ R3| hx, uii ≤ zi ∀i = 1, 2, 3, 4}. (6) Các số z1, . . . , z4 xác định hoàn toàn đa diện P. Tuy nhiên không phải bất cứ 4 số thực z1, . . . , z4 cũng xác định một đa diện theo (6), vì tập hợp định nghĩa bởi vế phải của (6) có thể không phải là đa diện, thậm chí có thể rỗng. Bài tập 4.2. (a)Giả sử P được xác định bởi (z1, . . . , z4) theo (6), và v ∈ R3. Chứng minh rằng v + P được xác định bởi z01, . . . , z04, định nghĩa bởi z0i = zi + hv, uii. (b) Chứng minh rằng (z1, . . . , z4) xác định một đa giác P nếu và chỉ nếu tồn tại x ∈ R3sao cho hx, uii < zi ∀i = 1, 2, 3, 4. (c) Chứng minh rằng z1 = z2 = z3 = z4 = 1 xác định một đa diện nào đó thoả mãn (5). Vì ta sẽ đồng nhất P với P + v, ta sẽ chọn v sao cho (z1, . . . , z4) là đơn giản, như sau. Từ tính chất (4) dễ dàng suy ra rằng các mặt phẳng qua F2, F3, F4 cắt nhau tại một điểm duy nhất. Ở đây Filà mặt của P có vector pháp tuyến ui. Sau một phép tịnh tiến, ta có thể giả sử các mặt phẳng qua F2, F3, F4 cắt nhau tại gốc tọa độ ~0. (7) Giả sử P0là tập hợp tất cả các đa giác thoả mãn (5) và (7). Với P ∈ P0, và các số z1, z2, z3, z4 của (6), ta có z2 = z3 = z4 = 0. Vì vậy P được xác định duy nhất bởi z1 = z1(P). Ta có ánh xạ z1 : P0 → R. Gọi P = z1(P0) là ảnh của P. Bài tập 4.3. Chứng minh P = R+ = {x ∈ R | x > 0}, và z1 : P0 → P là song ánh. Như vậy tập hợp tất cả các đa giác thoả mãn (5) và (7) có thể đồng nhất với tập hợp P = R+. Vói z ∈ P = R+, ta ký hiệu P(z) ∈ P0là đa giác thoả mãn z1 = z, z2 = z3 = z4 = 0. Khi đó P : P → P0là song ánh. 4.2. Tập hợp các diện tích có thể có Giả sử Q0là tập hợp tất cả (y1, y2, y3, y4) ∈ (R+)4sao cho y1u1 + y2u2 + y3u3 + y4u4 = ~0. Một vector trong R3có 3 thành phần, vì vậy đẳng thức trên cho ra 3 phương trinh tuyến tính với 4 ẩn số y1, y2, y3, y4. Nói chung tập hợp lời giải sẽ là không gian 1 chiều. Ngoài ra ta còn phải giới hạn yi > 0. 22 Tạp chí Epsilon, Số 10, 08/2016 Đặt π : R4 → R là phép chiếu lên toạ độ thứ nhất, tức là π(y1, . . . , y4) = y1. Đặt Q = π(Q0), và ký hiệu α : Q0 → Q là giới hạn của π trên tập Q0. Bài tập 4.4. (a) Chứng minh rằng Q0thoả mãn: nếu x, y ∈ Q0 và k ∈ R+ thì x + y ∈ Q0 va kx ∈ Q0. (b) Sử dụng điều kiện (4), chứng minh rằng α là song ánh. (b) Chứng minh rằng Q = R+. 4.3. Ánh xạ diện tích mặt Giả sử z ∈ P. Đặt Ai(z) là diện tích mặt Fi của đa giác P(z), và A : Q → R4là ánh xạ A(z) = (A1(z), . . . , A4(z)). Phần (a) của định lý Minkowski chứng minh rằng A(P) ⊂ Q0. Phần (b) của định lý Minkowski 3 chiều tương đương với mệnh đề sau đây mà ta sẽ chứng minh. Lemma 4.1. Ánh xạ A : P → Q0là song ánh. Chứng minh. Dễ dàng thấy rằng P(kz) = kP(z) voi moi k ∈ R+. Từ đó suy ra rằng A(kz) = k2A(z). (8) Đặt B : P → Q là composition R+ = PA−→ Q0 α−→ Q = R+. Đẳng thức (8) chứng tỏ rằng B(kz) = k2B(z) ∀z ∈ R+ & ∀k ∈ R+. Dễ dàng thấy rằng bất kỳ ánh xạ B : R+ → R+ nào thoả mãn điều kiện trên là một song ánh. Vì α là song ánh, ta suy ra A cũng là song ánh. Ta đã kết thúc chứng minh định lý Minkowski 3 chiều cho trường hợp n = 4. Trường hợp n > 4 được chứng minh tương tự, mặc dù phức tạp hơn, và sử dụng bất đẳng thức Brunn-Minkowski. Độc giả có thể tham khảo [1, 2]. 23 4.4. Sơ lược về trường hợp n > 4 Bằng cách đánh số lại, ta có thể giả sử Tạp chí Epsilon, Số 10, 08/2016 un−2, un−1, un không cùng trên một mặt phẳng. (9) Một đa giác P thỏa điều kiện các vector pháp tuyến mặt của P là u1, . . . , un (10) sẽ được hoàn toàn xác định bởi các số thực z1, . . . , zn sao cho P = {x ∈ R3| hx, uii ≤ zi ∀i = 1, . . . , n}. (11) Tuy nhiên không phải bất cứ n số thực z1, . . . , zn cũng xác định một đa diện theo (11). Bài tập 4.5. (b) Chứng minh rằng (z1, . . . , zn) xác định một đa giác P nếu và chỉ nếu tồn tại x ∈ R3sao cho hx, uii < zi ∀i = 1, . . . , n. (c) Chứng minh rằng z1 = · · · = zn = 1 xác định một đa diện nào đó thỏa mãn (10). Tính chất (9) suy ra rằng các mặt phẳng qua Fn−2, Fn−1, Fn cắt tại một điểm duy nhất. Sau một phép tịnh tiến, ta có thể giả sử các mặt phẳng qua Fn−2, Fn−1, Fn cắt nhau tại gốc tọa độ ~0. (12) Giả sử P0là tập hợp tất cả các đa giác thỏa mãn (10) và (12). Voi P ∈ P0, ta có zn−2 = zn−1 = zn = 0, vì vậy P được xác định duy nhất bởi z1, . . . , zm. O day m = n − 3. Đặt P ⊂ Rm là tập hợp tất cả z = (z1, . . . , zm) sao cho (z, 0, 0, 0) xác sinh một đa giác P ∈ P0. Ánh xạ P → P0, z → P(z) là song ánh. Bài tập 4.6. (a) Chứng minh P là một cone lồi, tức là nếu z, z0 ∈ P và k ∈ R+ thì kz ∈ P và z + z0 ∈ P. (b) Chứng minh P là một tập hợp mở, tức là nếu z ∈ P thì tồn tại ε > 0 sao cho nếu kz0−zk < ε thì z0 ∈ P. Giả sử Q0là tập hợp tất cả (y1, . . . , yn) ∈ (R+)nsao cho Pni=1 yiui = ~0. Đặt π : Rn → Rm là phép chiếu lên m tọa độ đầu tiên. Đặt Q = π(Q0), và ký hiệu α : Q0 → Q là giới hạn của π trên tập Q0. Bài tập 4.7. (a) Chứng minh rằng Q0là mot cone loi. (b) Sử dụng điều kiện (4), chứng minh rằng α la song ánh. (b) Chứng minh rang Q là một cone lồi mở trong Rm. 24 Tạp chí Epsilon, Số 10, 08/2016 Với z ∈ P dat Ai(z) la diện tích mặt Fi của đa giác P(z), và A : Q → Rnlà ánh xạ A(z) = (A1(z), . . . , An(z)). Đăt B = α ◦ A. Phần (a) của định lý Minkowski chứng minh rằng A(P) ⊂ Q. Phần (b) của định lý Minkowski 3 chiều tương đương với mệnh đề sau Lemma 4.2. Ánh xạ B : P → Q là song ánh. Như vậy ta phải chứng minh với mọi a ∈ Q tồn tại duy nhất z ∈ P sao cho B(z) = a. Bài toán tìm z sẽ đưuợc đưa về bài toán tìm cực trị của một hàm số lồi và trơn, và lời giải duy nhất của nó được khẳng định bới đính lồi và trơn của hàm số. em chi tiết tại [2]. Alexandrov có một chứng minh thú vị khác, bằng cách trước hết chứng minh tính duy nhát, rồi dùng tính chât tôpô của miền xác định và miền giá trị của B để chứng minh tính tồn tại. Xem chi tiết tại [1]. Tài liệu [1] A. D. Alexandrov, Convex polyhedra (translation of the 1950 Russian original), Springer, Berlin, 2005. [2] I. Pak, Lectures on Discrete and Polyhedral Geometry, online at http://www.math.ucla.edu/~pak/geompol8.pdf 25 Tạp chí Epsilon, Số 10, 08/2016 TOÁN HỌC VÀ NGHỆ THUẬT TUNG HỨNG Nguyễn Hùng Sơn GIỚI THIỆU Tung hứng là một bộ môn nghệ thuật cổ xưa, dường như luôn đồng hành với lịch sử của nhân loại. Nhiều bản vẽ mô tả những người phụ nữ đang tung hứng được tìm thấy trong một ngôi mộ của Ai Cập có niên đại vào khoảng thế kỷ thứ hai mươi trước công nguyên. Chỉ cần một vài viên đá và một chút luyện tập là bạn đã có thể tung hứng. Vì vậy không có gì đáng ngạc nhiên khi loài người quan tâm đến môn nghệ thuật này từ rất lâu rồi. Tuy nhiên, chỉ mới gần đây khía cạnh toán học của tung hứng mới bắt đầu được quan tâm một cách nghiêm túc. Các nghiên cứu toán học về các mô hình tung hứng được tiến hành lần đầu tiên cùng một lúc vào những năm 80 của thế kỷ XX tại vài trường đại học, trong đó có Đại học California tại Santa Cruz, Caltech và Đại học Cambridge. Trong bài báo nhỏ này chúng ta sẽ liệt kê một cách ngắn gọn về các kết quả mà các nhà toán học có thể giúp các nghệ sĩ xiếc trong việc tạo ra các mô hình tung hứng và các lợi ích do sự hợp tác liên ngành này có thể đem lại cho các nhà toán học. 26 Tạp chí Epsilon, Số 10, 08/2016 Hình 1: Những hình ảnh cổ nhất về tung hứng cách đây khoảng 4000 năm. Bước đầu tiên là tạo ra các mô hình toán học cho các kỹ thuật tung hứng để có thể nói về chúng một cách chính xác. Trong các mô hình đơn giản nhất, ta giả sử thời gian là rời rạc (chính xác hơn, thời gian là một chuỗi các thời điểm 1, 2, 3, . . .), và rằng nghệ sĩ tung hứng có hai tay, mỗi tay chỉ có thể giữ được nhiều nhất một vật trong mỗi thời điểm. Không mất tính tổng quát ta giả sử các vật dùng để tung hứng là các quả bóng. Các tay thay đổi nhau liên tục, có nghĩa là một tay sẽ luôn bắt (hứng) và tung bóng ở các thời điểm lẻ: 1, 3, 5, ... (ta gọi đó là tay lẻ), còn tay thứ hai (tay chẵn) thì luôn tung và hứng ở các thời điểm chẵn: 2, 4, 6, .... Và bây giờ sẽ là vấn đề thú vị hơn: làm thế nào để mô hình hóa các cách tung bóng khác nhau và đồng thời cho nhiều quả bóng khác nhau? Phương pháp thường dùng nhất là phân loại các cách tung bóng theo thời gian (số khoảnh khắc) mà quả bóng bay trên không. Điều đó có nghĩa rằng nếu tại thời điểm i ta tung bóng theo kiểu t ( với t là một số tự nhiên nào đó) thì bóng sẽ rơi (vào một trong hai tay) vào thời điểm i + t. Lưu ý rằng với cách ký hiệu này, nếu bóng được tung theo kiểu chẵn bằng một trong hai tay thì nó sẽ rơi vào đúng tay đó, còn theo kiểu lẻ thì bóng sẽ rơi vào tay thứ hai. Ta cũng ký hiệu kiểu 0 cho trường hợp không tung bóng, tức là một trong hai tay được gọi là tung bóng theo kiểu 0 tại thời điểm i nếu tay đó không có bóng tại thời điểm này. Hình 2 là ví dụ của một dãy các cách tung hứng bóng theo trình tự thời gian. Trong ví dụ này người nghệ sĩ tung hứng dùng ba quả bóng được đánh dấu bằng ba mầu. Ngoài ra trên hình vẽ còn có một số thông tin bổ sung (về cấu hình) và sẽ được giải thích sau. Hoạt động của người nghệ sĩ tung hứng trong ví dụ này có thể được mô tả ở dạng một dãy các cách tung bóng trong từng thời điểm, đó là h5, 3, 1, 4, 5, 3, 0, 5, 5, 2, 0, 5, 3, 1, 4, 5, 3, 0i. Cách ký hiệu này được gọi là phương pháp dãy hoán đổi (tiếng Anh là siteswap model). Tuy nhiên, trong thực tế các nghệ sĩ tung hứng thường quan tâm đến các mô hình tung hứng (tiếng Anh gọi là juggling pattern) hơn là cái dãy dài dằng dặc như ở trên. Tốt nhất là nếu ta tìm được các dãy tuần hoàn để một dãy con hữu hạn có thể lặp đi lặp lại nhiều lần cho đến vô cùng. Ví dụ: một trong 27 Tạp chí Epsilon, Số 10, 08/2016 Hình 2: Ví dụ một dãy các cách tung hứng bằng hai tay các mô hình phổ biến nhất mà mọi người thường bắt đầu học là tung hứng 3 quả bóng theo kiểu thác nước. Kiểu tung hứng này tương đương với dãy h3, 3, 3, 3, 3, 3, 3...i. =⇒ Để tránh trùng lặp các thông tin vô ích, ta thường ký hiệu các dãy tuần hoàn bằng các thông tin trong một chu kỳ của nó. Như vậy mô hình tung hứng kiểu thác nước là dãy tuần hoàn (3). Tới đây ta có thể thấy hàng loạt các vấn đề toán học được đặt ra. Phải chăng tất cả các dãy hoán đổi đều khả thi (hợp thức)? Số quả bóng ảnh hưởng như thế nào đến mô hình? Tồn tại bao nhiêu mô hình tung hứng nếu ta cố định một số yếu tố như số lượng quả bóng hoặc số lần tung bóng? Trước khi tìm hiểu các câu hỏi trên ta hãy làm quen với một số tính chất của mô hình tung hứng ở dạng dãy hoán đổi (siteswap patterns): 28 Tạp chí Epsilon, Số 10, 08/2016 Định nghĩa 1 Gọi P = ht0 · · ·tk−1i là dãy hoán đổi với độ dài k. Dãy P được gọi là dãy tung hứng khi và chỉ khi hàm số σ : {0, . . . , k − 1} → {0, . . . , k − 1} xác định bởi σ(i) = i + ti mod k là một hoán vị của tập {0, . . . , k − 1}. Định nghĩa trên chỉ muốn nói rằng trong dãy tung hứng là dãy hoán đổi của quá trình tung hứng thực sự. Khi tung hứng, không tay nào được bắt hai quả bóng cùng một lúc, điều đó co nghĩa rằng các quả bóng đều phải rơi vào một trong hai tay ở các thời điểm khác nhau. Dễ thấy mọi dãy có độ dài k = 1 đều là dãy tung hứng và mọi dãy tuần hoàn dạng (n) cũng là dãy tung hứng tương ứng với tung hứng kiểu thác nước dùng n quả bóng. Bổ đề 1 (về giá trị trung bình) Trong mọi dãy hoán đổi tung hứng tuần hoàn a = (a0, a1, ..., ad−1) có độ dài d, giá trị trung bình của dãy a =a0+a1+...+ad−1 quả bóng được dùng để tung hứng. dlà một số tự nhiên và bằng đúng số Xin bỏ qua phần chứng minh bổ đề 1 và mong bạn đọc yêu thích toán học coi đây là một bài tập thú vị. Bổ đề trên đây có thể coi như là điều kiện cần để kiểm tra dãy hoán đổi có phải là dãy tung hứng khay không: nếu giá trị trung bình của dãy không phải là số nguyên thì đó không phải là dãy tung hứng. Ví dụ: • Dãy (5, 2, 1) có giá trị trung bình bằng 83, vì vậy đây không phải là dãy tung hứng. • Dãy (3, 2, 1) có giá trị trung bình bằng 2 nên có thể là dãy tung hứng cho 2 quả bóng. Tuy nhiên σ(1) = σ(2) = σ(3) = 0, vì vậy theo định nghĩa đây không phải là dãy tung hứng. • Các dãy (4, 4, 1), (5, 3, 1), (4, 4, 1, 3) (5, 5, 5, 0, 0) là các dãy tung hứng cho 3 quả bóng; còn (6, 4, 5, 1), (7, 3, 3, 3), (7, 1) là các dãy tung hứng cho 4 quả bóng. Hy vọng sau khi đọc xong bài viết này, bạn đọc có thể dễ dàng kiểm tra các thông tin trên. Hình 3: Ví dụ của dãy tung hứng tuần hoàn (4, 4, 1, 3). Benoˆıt Guerville đã phát hiện và chứng minh kết quả tuyệt vời liên quan đến điều kiện đủ xác định dãy tung hứng như sau: 29 Tạp chí Epsilon, Số 10, 08/2016 Định lý 2 (về tái cơ cấu) Nếu dãy số tự nhiên có giá trị trung bình cũng là số nguyên thì ta có thể hoán vị dãy đó thành một dãy tung hứng. Quay lại ví dụ trên Hình 2. Tại mỗi thời điểm ta hãy quan sát “vị trí" của quả bóng, tức là thời gian từ thời điểm đó cho đến khi quả bóng rơi vào một trong hai tay. Vì không tay nào được bắt hai quả bóng cùng một lúc nên tại một thời điểm tất cả các quả bóng phải ở các vị trí khác nhau. Ta có thể nói rằng bóng được tung lên vị trí k thay vì nói rằng bóng được tung theo kiểu k. Cấu hình tại một thời điểm bất kỳ là một dãy s0s1s2 . . . gồm các ký hiệu × và −. Ký hiệu sk = × nếu vị trí của một trong các quả bóng bằng k, còn sk = − khi không quả bóng nào ở vị trí này. Chiều dài của cấu hình thường là số tự nhiên hữu hạn tương ứng với vị trí cao nhất của các quả bóng. Trong ví dụ ở Hình 2 cấu hình tại mọi thời điểm đều có chiều dài bằng 5 (cột cuối cùng). Vị trí đầu tiên (ký hiệu s0) của cấu hình mô tả tình trạng của bàn tay chủ động, tức là tay lẻ ở thời điểm lẻ hoặc tay chẵn ở thời điểm chẵn. Điều đó có nghĩa là nếu ký hiệu đầu tiên của cấu hình là − thì bàn tay tương ứng không có bóng và tiếp theo tay đó sẽ tung bóng theo kiểu 0. Còn nếu ký hiệu đầu tiên là × thì quả bóng trong tay sẽ phải được tung lên một trong các vị trí có ký hiệu × (vị trí còn trống). Lưu ý: ta luôn có thể tung bóng lên vị trí cao nhất (tại sao?). Nếu cấu hình tại thời điểm i là Ci = s0s1s2 . . . sd−1 và s0 = − thì cấu hình tiếp theo sẽ là Ci+1 = s1s2 . . . sd−1−. Hai cấu hình được nối với nhau bằng mũi tên có trọng số bằng 0: Ci = −s1s2 . . . sd−10 −−−−→ Ci+1 = s1s2 . . . sd−1− Còn nếu s0 = × thì các cấu hình tại thời điểm tiếp theo sẽ được hình thành như sau: 1. Kéo dài cấu hình Cithành C0i = s0s1s2 . . . sd−1sd với sd = −; 2. Nếu sh = − và quả bóng được tung lên vị trí h thì ta sẽ đổi sh = ×; 3. Xóa s0 từ C0i. Cấu hình tại thời điểm i + 1 sẽ là Ci+1 = s1s2 . . . sd−1sd 4. Ta nối hai cấu hình bằng mũi tên có trọng số bằng h: Cih −−−−→ Ci+1 Bằng cách này ta có thể thiết lập biểu đồ chuyển dịch giữa các cấu hình. Hình 4 là ví dụ minh họa của biểu đồ hoán chuyển giữa các cấu hình khi tung hứng 3 quả bóng và vị trí cao nhất là 5. Biểu đồ này, thực chất là đồ thị có hướng và có trọng số. Sử dụng các cấu hình ta có thể dễ dàng kiểm tra xem một dãy hoán đổi có là dãy tung hứng hay không. Dễ dàng nhận thấy rằng mỗi một dãy tung hứng tương ứng với một dây chuyền trong biểu đổ. Hơn nữa dãy tung hứng tuần hoàn tương ứng với một chu trình trong biểu đồ. Cũng có thể sử dụng biểu đồ này để tạo ra các bài biểu diễn tung hứng mới và kỳ lạ. Nhiều nghệ sĩ (ví dụ ở công ty Gandini Juggling) đã sử dụng mô hình này để thiết kế các chương trình biểu diễn của mình. Bổ đề 1 có thể tổng quát hóa như sau: 30 Tạp chí Epsilon, Số 10, 08/2016 Hình 4: Biểu đồ dịch chuyển giữa các cấu hình. Định lý 3 (tổng quát về giá trị trung bình) Nếu a = ha0, a1, a2, . . .i là một dãy tung hứng có độ cao hữu hạn thì giới hạn P i∈I ai lim |I|→∞ |I| hội tụ và bằng số quả bóng, ở đây giới hạn được xác định cho tập hợp tất cả các khoảng I = {b, b + 1, . . . , c} ⊂ Z và |I| = c − b + 1 là số số tự nhiên trong khoảng I. Để ý rằng các kết quả toán học trong bài báo này không sử dụng đến giả thiết về hai bàn tay. Các kết quả trên đây vẫn đúng cho trường hợp tung hứng dùng nhiều “chi” hơn, ví dụ: 2 chân, 2 tay, đầu, nhiều người. Nghiên cứu về các dãy hoán chuyển vẫn là vấn đề thời sự và được tổng quát hóa cho nhiều trường hợp như: • Thời gian đồng bộ: nhiều chi cùng bắt bóng và tung bóng trong cùng một thời điểm; • Multiplexes: một tay có thể tung nhiều quả bóng trong cùng một thời điểm. Các nghiên cứu cơ bản về đề tài này cũng được tiến hành và khá nhiều bài báo đã được đăng, chủ yếu là về các vấn đề tổ hợp liên quan đến mô hình tung hứng. Một điều thú vị là một số kết quả liên quan đến tung hứng lại có thể sử dụng trong các ngành khác trong toán học. Một số nghiên cứu, kể cả một số luận án tiến sĩ (ví dụ như “Combinatorial aspects of juggling” của Anthony Mays) đã phát hiên rất nhiều sự liên hệ giữa các dãy hoán đổi (siteswap) với một số lý thuyết tiên tiến nhất trong toán học như tính toán chuỗi Poincare cho nhóm affine của Weyl A d−1 hoặc để chứng minh định lý liên quan đến số q-Stirling. Trước đó, nhiều người cho rằng các lý thuyết này là các mô hình toán học tưởng tượng, không thực dụng. 31 Tạp chí Epsilon, Số 10, 08/2016 Không có lý thuyết vô dụng trong toán học: sự liên kết giữa các kết quả toán học và cuộc sống thường xuất hiện một cách tình cờ trong các lĩnh vực mà bản thân các nhà toán học cũng không ngờ tới. Tài liệu [1] Tạp chí ‘Delta’ của Ba lan. Số 9. 2014 [2] Beek, Peter J. & Arthur Lewbel (1995), ‘The Science of Juggling’, Scientific American, Vol. 273, No 5, November 1995, p92–97. [3] Beever, Ben (2002), ‘Siteswap Ben’s guide to juggling patterns’, available at: www.jugglingdb.com/compendium/geek/notation/siteswap/bensguide.html. [4] Buhler, Joe, David Eisenbud, Ron Graham & Colin Wright (1994), ‘Juggling drops and de scents’, The American Mathematical Monthly, Vol. 101, No. 6, June–July 1994, p507–519. [5] Cardinal, Jean, Steve Kremer & Stefan Langerman (2006), ‘Juggling with pattern match ing’, Theory of Computing Systems, 39(3), June 2006, p425– 437. [6] Carstens, Ed (1992), ‘The mathematics of juggling’, online publication, available at: www.juggling.org/papers/carstens/. [7] Polster, Burkard (2003), ‘The mathematical of juggling’. Springer-Verlag, New York. [8] Shannon Claude E. (1980), ‘Scientific Aspects of Juggling’. In N.J.A. Sloane and A. D. Wyner (eds) (1993) Claude Elwood Shannon: Collected Papers. IEEE Press. [9] Anthony Mays (2006), ‘Combinatorial aspects of juggling’. Ph.D Thesis at University of Melbourne. 32 Tạp chí Epsilon, Số 10, 08/2016 HỆ MẬT MÃ KHÓA CÔNG KHAI DỰA TRÊN ĐƯỜNG CONG ELLIPTIC - MỘT SỐ ỨNG DỤNG Đặng Minh Tuấn (Vietkey) TÓM TẮT Ở Epsilon số 9, chúng tôi đã giới thiệu tổng quan về hệ mật mã khóa công khai dựa trên đường cong Elliptic qua phần đầu của chuyên đề có cùng tên gọi của tác giả Đặng Minh Tuấn. Trong số này, Epsilon trân trọng giới thiệu phần tiếp theo (và cũng là phần kết) của loạt chuyên đề thông qua các ứng dụng của hệ mật mã khóa công khai dựa trên đường cong Eplliptic. 1. Bài toán Logarithm rời rạc Định nghĩa 1.1. Bài toán Logarithm rời rạc trên đường cong Elliptic (ECDLP): Cho đường cong E trên trường hữu hạn Fq, điểm P ∈ E(Fq) với bậc n (nP = O = ∞) và điểm Q ∈ E(Fq), tìm số nguyên k ∈ [0, n − 1] sao cho Q = kP. Số nguyên k được gọi là Logarithm rời rạc của Q với cơ sở P, và thường được viết là k = logP Q. Bất kỳ một hệ mật khóa công khai nào cũng phải sử dụng một bài toán khó để xây dựng hàm một chiều. Ý nghĩa một chiều ở đây có nghĩa là tính thuận thì dễ (thuật toán giải trong thời gian đa thức) và tính ngược thì khó (thuật toán giải với thời gian không phải là đa thức - thường là hàm mũ hoặc nửa mũ). Các tham số của Hệ mật dựa trên đường cong Elliptic (ECC) cần phải được lựa chọn cẩn thận để tránh được các tấn công đối với bài toán ECDLP. Thuật toán vét cạn để giải bài toán ECDLP là lần lượt tính thử các điểm P, 2P, 3P, ... cho đến khi điểm mới tính được đúng bằng điểm Q. Trong trường hợp xấu nhất sẽ phải cần đến n bước thử, trung bình thường là n/2 là đạt được điểm Q, do đó cần phải chọn n đủ lớn để bài toán vét cạn là không khả thi (n ≥ 2160). Thuật toán tốt nhất hiện nay để tấn công bài toán ECDLP là sự kết hợp của thuật toán Pohlih Hellman và Pollard’s rho, thuật toán này có thời gian tính là O(√p), với p là ước số nguyên tố lớn nhất của n do đó phải chọn số n sao cho nó chia hết số nguyên tố p lớn nhất có √p đủ lớn để giải bài toán này là không khả thi. Trong phần tiếp theo, một số phương pháp tấn công bài toán Logarithm rời rạc sẽ được trình bày, đa số các phương pháp này có thể áp dụng được cho một nhóm bất kỳ. Chi tiết có thể tham khảo trong [3, 8, 21]. 33 Tạp chí Epsilon, Số 10, 08/2016 Cho G là nhóm các điểm trên đường cong E. P, Q ∈ G là các điểm trên đường cong E, chúng ta cần giải bài toán kP = Q, N là bậc của G. 1.1. Phương pháp bước nhỏ, bước lớn Phương pháp này do Shanks đề xuất và được H. Cohen mô tả trong [22]. Thuật toán 1 Phương pháp bước nhỏ, bước lớn 1: Chọn m ≥√N và tính mP. 2: Tính và lưu trữ danh sách iP với 0 ≤ i < m 3: Tính Q − jmP với j = 0, 1, . . . , m − 1 4: if iP = Q − jmP then 5: k = i + jm( mod N) 6: end if 7: Quay về bước 3 Dễ dàng nhận thấy Q = iP + jmP hay Q = (i + jm)P từ đó k = i + jm. Điểm iP được tính bằng cách cộng thêm P vào (i − 1)P và giá trị này được gọi là bước nhỏ. Q − jmP được tính bằng cách cộng thêm mP vào Q − (j − 1)mP và giá trị này được gọi là bước lớn. 1.2. Phương pháp Pollard’s ρ và λ Phương pháp này do Pollard đề xuất trong [23]. Định nghĩa hàm f : G → G một cách ngẫu nhiên Pi+1 = f(Pi) với P0 cũng được chọn một cách ngẫu nhiên. Bởi vì G là tập hữu hạn do đó sẽ có các chỉ số i0 < j0 mà Pi0 = Pj0, từ đó ta có: Pi0+1 = f(Pi0) = f(Pj0) = Pj0+1 Tương tự sẽ có Pi0+l = Pj0+l với l ≥ 0, từ đó chuỗi Pilà chuỗi tuần hoàn với chu kỳ là j0 − i0. Hàm biểu diễn chuỗi Pithường giống chữ cái Hi Lạp ρ và đó là lý do tại sao phương pháp này có tên là phương pháp ρ. Hàm f được chọn như sau: Chia tập G thành s tập con không trùng nhau S1, S2, . . . , Ss có kích thước tương đương nhau, s thường được chọn là 20, chọn 2s số ngẫu nhiên ai, bi mod N. Đặt: Mi = aiP + biQ Và định nghĩa: f(g) = g + Mi, g ∈ Si 34 Tạp chí Epsilon, Số 10, 08/2016 Biểu diễn Pj dưới dạng Pj = ujP + vjQ, khi Pi0 = Pj0ta có: uj0P + vj0Q = ui0P + vi0Q (ui0 − uj0)P = (vj0 − vx‘j0)Q k = (vj0 − vx‘j0)1(ui0 − uj0) (mod N) Phương pháp này cũng tương tự như phương pháp trên cần √N bước, tuy nhiên không gian lưu trữ sẽ nhỏ hơn. 1.3. Phương pháp Pohlig-Hellman Pohlig và Hellman đề xuất phương pháp này trong [24]. Nếu có thể phân tích bậc N của G thành các thừa số nguyên tố thì có thể viết: N =Y qei i i Ý tưởng của phương pháp này là tìm k (mod qei i) với mỗi i, sau đó áp dụng định lý đồng dư Trung Hoa để tính k (mod N). Coi q là số nguyên tố và qelà lũy thừa e của q được chia hết bởi N, viết k dưới dạng sau: k = k0 + k1q + k2q2 + · · · , 0 ≤ ki < q Lý giải thuật toán 2 như sau: N qQ =Nq(k0 + k1q + · · ·) P = k0NqP + (k1 + k2q + · · ·) NP = k0NqP Bởi vì NP = ∞ và từ đây có thể tìm được k0. Tiếp theo: Q1 = Q − k0P =k1q + k2q2 + · · · P N q2Q1 =Nq(k1 + k2q + · · ·) P = k1NqP + (k2 + k3q + · · ·) NP = k1NqP Từ đó tìm được k1, tương tự như vậy chúng ta sẽ tìm được k2, k3 . . . Thuật toán sẽ dừng khi e = r + 1, khi đó N/qe+1 không còn là số nguyên nữa và chúng ta không thể nhân Qe với một số hữu tỷ. 35 1: Tính T = n j N qP Tạp chí Epsilon, Số 10, 08/2016 Thuật toán 2 Phương pháp Pohlig-Hellman o | 0 ≤ j ≤ q − 1. 2: Tính Nq Q. Đó là phần tử k0 3: if e = 1 then 4: Nhảy đến bước 15. 5: end if 6: Q1 ← Q − k0P N qP của T. 7: Tính Nq2Q1. Đó là phần tử k1 8: if e = 2 then 9: Nhảy đến bước 15. 10: end if N qP của T. 11: Lần lượt tính được các giá trị k0, k1, . . . , kr−1 và Q0, Q1, . . . , Qr−1 12: Qr ← Qr−1 − kr−1qr−1P 13: Xác định kr sao cho N qr+1Qr = kr 14: if e = r + 1 then N qP 15: k = k0 + k1q + k2q2 + · · · + ke−1qe−1( mod qe) 16: Stop. 17: end if 18: Quay về bước 11. 1.4. Phương pháp tấn công MOV Tấn công MOV là tên viết tắt của các tác giả Menezes, Okamoto, và Vanstone [25], sử dụng cặp Weil để chuyển đổi bài toán Logarithm rời rạc trong E(Fq) thành bài toán Logarithm rời rạc trong F×qm. Bởi vì giải bài toán Logarithm rời rạc trong trường hữu hạn sẽ dễ dàng và nhanh hơn giải Logarithm rời rạc trong nhóm các điểm trên đường cong Elliptic. Chọn m sao cho: E[N] ⊆ F×qm Bởi vì tất cả các điểm trong E[N] đều có tọa độ trong Fq = ∪j≥1Fqj, nên m tồn tại. Theo định nghĩa về cặp Weil và các thuộc tính của cặp song tuyến tính: ζ2 = eN (Q, T1) = eN (kP, T1) = eN (P, T1)k = ζk1 Thuật toán 3 Tấn công MOV 1: Chọn điểm ngẫu nhiên T ∈ E(Fqm). 2: Tính bậc M của T. 3: Cho d = gcd(M, N) và cho T1 = (M/d)T có nghĩa là T1 có bậc là d, chia hết bởi N, do đó T1 ∈ E[N]. 4: Tính các cặp Weil ζ1 = eN (P, T1) và ζ2 = eN (Q, T1). Cả hai ζ1, ζ2 ∈ µd ⊆ F×qm. 5: Giải bài toán Logarithm rời rạc ζ2 = ζk1trong F×qm, sẽ tính được k (mod N). 6: Lặp lại với điểm ngẫu nhiên T cho đến khi bội số chung nhỏ nhất của các số d là N, từ đó xác định được k (mod N). 36 Tạp chí Epsilon, Số 10, 08/2016 2. Tham số của hệ mật ECC Các tham số của hệ mật ECC cần được lựa chọn kỹ càng để tránh các tấn công như MOV, trong quá trình lựa chọn hệ ECC cần phải đạt được một số tiêu chí được mô tả trong chuẩn [26]. Định nghĩa 2.1. Tham số hệ mật D = (q, F R, S, a, b, P, n, h) là một tập hợp gồm: 1. Bậc của trường Fq là q. 2. Phương pháp biểu diễn trường FR (field representation) được sử dụng cho các phần tử của Fq. 3. S là mầm được sử dụng trong trường đường cong Elliptic được tạo ra một cách ngẫu nhiên. 4. Hai hệ số a, b ∈ Fq được dùng để định nghĩa đường cong E trên Fq (nghĩa là y2 = x3 + ax + b). 5. P là một điểm có bậc nguyên tố n và gọi là điểm cơ sở P = (xP , yP ) ∈ E(Fq). 6. Đồng hệ số h = #E(Fq)/n. 3. Trao đổi khóa Trong các mục còn lại, chuyên đề sẽ đề cập đến một số thuật toán ứng dụng trong trao đổi khóa, mã hóa và ký số cơ bản. Chuẩn do công ty Certicom xây dựng [26] mô tả chi tiết việc triển khai ứng dụng ECC. Tác giả D. Hankerson [18] phân tích việc triển khai ECC bằng phần mềm, trong khi đó tác giả L. Cao [27] phân tích thực hiện các giao thức cơ bản của ECC bằng phần cứng. 3.1. Trao đổi khóa Diffie–Hellman ECDH Năm 1998, Laurie và cộng sự đề xuất giao thức trao đổi khóa dựa trên ECC [28]. Sau đó giao thức này đã được đưa vào các tiêu chuẩn ANSI X9.42, ANSI X9.63 và IEEE P1363. Hai bên A và B cần tạo khóa phiên bí mật trao đổi trong một kênh truyền công khai, hai bên cùng thỏa thuận điểm cơ sở P trên E. Bên A tạo khóa bí mật dA và gửi giá trị dAP cho bên B, ngược lại bên B tạo khóa bí mật dB nhân với P sau đó gửi lại cho A. Khi đó khóa phiên của bên A sẽ là KA = dAdBP, và của bên B sẽ là KB = dBdAP. Dễ dàng nhận thấy KA = KB, khóa này chỉ riêng hai bên A và B có thể tính được. Xem sơ đồ dưới đây: Bên A Bên B dAdAP −−−−−−−−−−−−→ dAP dBPdBP ←−−−−−−−−−−−− dB KA = dAdBP KB = dBdAP 37 Tạp chí Epsilon, Số 10, 08/2016 Đánh giá bảo mật: Để tìm được khóa chia sẻ KA hoặc KB, Hacker buộc phải tìm được cả 2 khóa bí mật dA, dB, trong khi chỉ có thể bắt được thông tin trên đường truyền là dAP và dBP, khi biết P, Hacker buộc phải giải bài toán Logarithm rời rạc dA = logP(dAP) và dB = logP(dBP) và đây là bài toán khó không giải được trong thời gian đa thức. 3.2. Tạo khóa bí mật chia sẻ ECMQV Tên đầy đủ của giao thức là Elliptic Curve Menezes-Qu-Vanstone. Thuật toán đã được đưa vào trong các chuẩn ANSI X9.63, IEEE 1363-2000, và ISO/IEC 15946-3. Theo các tiêu chuẩn này điểm cơ sở được ký hiệu là G thay vì là P như thường gặp. Lược đồ này thường được sử dụng khi các bên A và B có cặp khóa công khai và bí mật cố định, tương ứng là (a, aG) và (c, cG). Bên A sinh cặp số ngẫu nhiên (b, bG) và bên B tương ứng sinh cặp số ngẫu (d, dG), và trao đổi 2 cặp nay cho nhau giá trị bG và dG. Kí hiệu hàm x : E → N, lấy giá trị x của một điểm trên đường cong E. Thuật toán 4 Tạo khóa bí mật chia sẻ ECMQV INPUT: Các tham số của hệ mật (K, E, q, h, G), các số a, b, aG, bG, cG và dG. OUTPUT: Khóa bí mật chia sẻ Q (chia sẻ với với đối tượng có khóa công khai cG). 1: n ← dlog2(#k)e/2. 2: u ← (x(bG)(mod 2n) + 2n. 3: s ← b + ua((mod q). 4: v ← (x(dG)(mod 2n) + 2n. 5: Q ← s(dG + v(cG)). 6: if Q = ∞ then 7: Quay lại bước 1. 8: end if 9: Trả về khóa Q. Bên B có thể tính ra cùng số Q bằng cách thay (a, b, c, d) trong thuật toán trên bằng (c, d, a, b). Bên A sẽ có các giá trị uA, vA, sA và bên B sẽ có uB, vB, sB. Dễ dàng nhận thấy [10]: uA = vB uB = vA QA = sA(dG + vA(cG)) = sA(d + vAc)G = sA(d + uBc)G = sAsBG QB = sB(bG + vB(aG)) = sB(b + vBa)G = sB(b + uAa)G = sBsAG QA = QB = Q Đánh giá bảo mật: Để hack được khóa chia sẻ, Hacker cần phải tính được các giá trị a, b, c, d, muốn vậy Hacker phải giải các bài toán Logarithm rời rạc a = logG(aG), b = logG(bG), c = logG(cG), d = logG(dG). Đây là các bài toán khó không thể giải được trong thời gian đa thức. 38 Tạp chí Epsilon, Số 10, 08/2016 4. Xác thực - chữ ký số 4.1. ECDSA(The Elliptic Curve Digital Signature Algorithm) Năm 1999, ECDSA (The Elliptic Curve Digital Signature Algorithm) đã được phê duyệt thành tiêu chuẩn của ANSI (ANSI X9.62-1998 ECDSA, phiên bản mới nhất là X9.62-2005), năm 2000 ECDSA cũng được IEEE và NIST phê duyệt thành tiêu chuẩn FIPS PUB 186-4 (DSS - Digital Signature Standard), phiên bản mới nhất ban hành 7-2013. ISO năm 2002 cũng ban hành tiêu chuẩn ISO/IEC 15946-2:2002 trong đó có phần dành riêng về ECDSA. Mô tả chi tiết về ECDSA có thể tìm thấy trong [29]. Người ký sẽ chọn số d làm khóa bí mật và tạo ra khóa công khai là Q = dP, sử dụng hàm băm H để tạo ra giá trị tóm lược văn bản e của văn bản m. Chữ ký số sẽ là cặp (r, s) được tính theo thuật toán 5. Thuật toán 5 Sinh chữ ký số ECDSA INPUT: Tham số D = (q, FR, S, a, b, P, n, h), khóa bí mật d, thông điệp m. OUTPUT: Chữ ký số (r, s). 1: Chọn ngẫu nhiên k ∈ [1, n − 1], 2: R ← kP = (x1, y1) và chuyển đổi x¯1 ← x1. 3: r ← x¯1 (mod n). 4: if r = 0 then 5: Nhảy đến bước 1: 6: end if 7: e ← H(m). 8: s ← k−1(e + dr) (mod n). 9: if s = 0 then 10: Nhảy đến bước 1: 11: end if 12: Trả về (r, s) Người xác thực chữ ký nhận được văn bản m0 và chữ ký số (r, s) của người ký, sẽ tính giá trị tóm lược e0của văn bản nhận được là m0 và áp dụng thuật toán 6 để xác định sự phù hợp của chữ ký số với văn bản nhận được, từ đó có thể khẳng định văn vản có do đúng người ký ký hay có sự giả mạo từ người khác hoặc văn bản có bị sửa đổi hay bị lỗi do đường truyền hay không. 39 Tạp chí Epsilon, Số 10, 08/2016 Thuật toán 6 Xác thực chữ ký số ECDSA INPUT: Tham số D = (q, FR, S, a, b, P, n, h), khóa công khai Q = dP, thông điệp nhận được m0, chữ ký (r, s). OUTPUT: Chữ ký hợp lệ hoặc không hợp lệ. 1: Kiểm tra r và s có phải là những số nguyên nằm trong khoảng [1, n − 1]. Nếu không trả về return(“Chữ ký không hợp lệ”). 2: e0 ← H(m0). 3: w ← s−1(mod n). 4: u1 ← e0w (mod n) và u2 ← rw (mod n). 5: R0 ← u1P + u2Q. 6: if R0 = ∞ then 7: return(“Chữ ký không hợp lệ”). 8: end if 9: Chuyển đổi x1 của R0 → số nguyên x¯1. 10: r0 ← x¯1 (mod n). 11: if r0 = r then 12: return(“Chữ ký hợp lệ”). 13: else 14: return(“Chữ ký không hợp lệ”). 15: end if Chứng minh tính đúng đắn của thuật toán: cần phải chứng minh rằng nếu m0 = m hay e = e0 thì r0 = r. Thực vậy: w = s−1 = k(e + dr)−1 R0 = u1P + u2Q = (u1 + u2d)P = (e0 + rd)wP = (e0 + rd)s−1P = k(e0 + rd)(e + rd)−1P Nếu e = e0ta sẽ có R0 = k(e + rd)(e + rd)−1P = kP = R là điều cần phải chứng minh. Đánh giá bảo mật: Để giả mạo được chữ ký, Hacker cần phải tìm được giá trị k và khóa bí mật d, để tìm được 2 giá trị này Hacker buộc phải giải 2 bài toán Logarithm rời rạc k = logP R và d = logP Q và đây đều là 2 bài toán khó, chưa giải được trong thời gian đa thức. 4.2. Chữ ký số ElGamal Dựa trên lược đồ ký số do ElGamal đề xuất năm 1984 [30], phiên bản sửa đổi đã được đưa vào thành chuẩn về chữ ký số DSS (Digital Signature Standard) trong FIPS 186 [31]. Định nghĩa hàm f như sau: f : E(Fq) → Z Có thể chọn hàm f(x, y) = x, trong đó x là số nguyên 0 ≤ x < q. Cặp khóa bí mật và công khai của người ký là (x, Y ) | Y = xP. N là bậc của điểm P thường là số nguyên tố lớn. 40 Tạp chí Epsilon, Số 10, 08/2016 Thuật toán 7 Sinh chữ ký số Elgamal INPUT: Khóa bí mật x, thông điệp m. OUTPUT: Chữ ký số (R, s). 1: Chọn ngẫu nhiên k ∈ [1, n − 1], 2: R ← kP. 3: s = k−1(m − xf(R)). 4: Trả về (R, s) Thuật toán 8 Xác thực chữ ký số Elgamal INPUT: Khóa công khai Y = xP, thông điệp nhận được m0, chữ ký (R, s). OUTPUT: Chữ ký hợp lệ hoặc không hợp lệ. 1: Tính V1 = f(R)Y + sR. 2: Tính V2 = m0P. 3: if V1 = V2 then 4: return(“Chữ ký hợp lệ”). 5: else 6: return(“Chữ ký không hợp lệ”). 7: end if Chứng minh tính đúng đắn của thuật toán: khi m0 = m: V1 = f(R)Y + sR = f(R)xP + k−1(m − xf(R))R = mP = m0P = V2 Đánh giá bảo mật: Muốn giả mạo chữ ký số, Hacker buộc phải tính được s, để tính được s buộc phải tính được k và khóa bí mật x, để tính được 2 giá trị này Hacker buộc phải giải bài toán Logarithm rời rạc k = logP R và x = logP Y , là 2 bài toán không giải được trong thời gian đa thức. 5. Mã hóa - Giải mã 5.1. Mã hóa Massey-Omura Massey-Omura là hai tác giả để xuất lược đồ mã hóa được mô tả trong Patent [32] vào năm 1986. Lược đồ mã hóa này ít được sử dụng trong thực tế nhưng nó có ý nghĩa về mặt lịch sử. Bên A Bên B Biểu diễn thông điệp như M ∈ E(Fq) Chọn mA | gcd(mA, N) = 1M1=mAM −−−−−−−−−−−−→ M1 M2M2=mBM1 ←−−−−−−−−−−−− Chọn mB | gcd(mB, N) = 1 M3=m−1 Tính m−1 A ∈ ZN A M2 −−−−−−−−−−−−→ M3 M = m−1 B M3 41 Tạp chí Epsilon, Số 10, 08/2016 Dễ dàng nhận thấy: m−1 B m−1 A mBmAM = M Đánh giá bảo mật: Muốn phá khóa trong lược đồ này, Hacker phải tìm được giá trị mA, mB để tìm được các giá trị này Hacker phải lần lượt giải 2 bài toán Logarithm rời rạc mA = logM M1 và mB = logM1 M2, và đây là 2 bài toán chưa giải được trong thời gian đa thức. 5.2. Mã hóa ElGamal Trên cơ sở hệ mật ElGamal [30], lược đồ mã hóa được phát biểu như sau: Bên A Bên B Thông điệp M ∈ E(Fq) Chọn cặp khóa (xB, YB) | YB = xBP Chọn k, tính M1 = kP Tính M2 = M + kYBM1,M2 −−−−−−−−−−−−→ M1, M2 M = M2 − xBM1 Chứng minh tính đúng đắn của lược đồ mã hóa: M = M2 − xBM1 = M + kYB − xBM1 = M + k(xBP) − xB(kP) = M Đánh giá bảo mật: Để giải mã được văn bản M, Hacker buộc phải tìm được k và xB, do đó Hacker cần phải giải 2 bài toán Logarithm rời rạc k = logP M1 và xB = logP YB, và đây là 2 bài toán khó. 5.3. Mã hóa ECIES (The Elliptic Curve Integrated Encryption Sys tem) ECIES do Bellare và Rogaway đề xuất và là một biến thể của mã hóa dùng hệ mật ElGamal, sau đó thuật toán này đã được đưa vào các chuẩn ANSI X9.63 và ISO/IEC 15946-3, IEEE P1363a và [26]. Tham số D = (q, FR, S, a, b, P, n, h) được chọn tương tự như với ECDSA. Ở đây cần lựa chọn thêm các hàm mã hóa/giải mã đối xứng ký hiệu là Ek(m) và Dk(c). Trong đó m là bản rõ cần mã hóa, c là bản đã được mã. Thuật toán mã hóa đối xứng được chọn ở đây để phục vụ quá trình mã hóa/giải mã được dễ dàng hơn và nhanh hơn so với các thuật toán bất đối xứng. Ngoài ra thay vì sử dụng hàm băm đơn giản, ECIES sẽ sử dụng hai hàm băm sau: • Message authentication code MACk(c): MAC : {0, 1}n × {0, 1}∗ −→ {0, 1}n 42 Tạp chí Epsilon, Số 10, 08/2016 • Key derivation function KD(T, l): KD : E × N −→ {0, 1}∗ l là độ dài khóa (k1||k2). {0, 1} là chuỗi bit có giá trị 0, 1 có độ dài n hoặc không xác định (*). Người nhận có cặp khóa công khai/bí mật là (Y, x) trong đó Y = xP. Thuật toán 9 Mã hóa ECIES INPUT: Văn bản cần mã hóa m, khóa công khai Y . OUTPUT: Văn bản đã được mã hóa (U, c, r). 1: Chọn k ∈ [1, q − 1]. 2: U ← kP. 3: T ← kY . 4: (k1kk2) ← KD(T, l). 5: Mã hóa văn bản, c ← Ek1(m). 6: Tính giá trị MAC cho văn bản mã hóa r = MACk2(C) 7: Trả về return(U, c, r). Bên giải mã sẽ nhận được tập hợp (U, c, r) gồm các thành phần sau: • U cần thiết để tính khóa phiên Diffie–Hellman T. • c là bản đã được mã hóa. • r được dùng để xác thực mã văn bản.. Thuật toán 10 Giải mã ECIES INPUT: Văn bản mã hóa U, c, r, khóa bí mật x. OUTPUT: Văn bản đã giải mã m hoặc thông báo “văn bản mã không hợp lệ”. 1: T ← xU. 2: (k1kk2) ← KD(T, l). 3: Giải mã văn bản, m ← Dk1(c). 4: if r 6= MACk2(C) then 5: xuất thông báo “văn bản mã không hợp lệ” 6: end if 7: Trả về văn bản đã được giải mã m. Khóa phiên T sau khi được tính trong phần giải mã sẽ có giá trị giống như trong phần mã hóa. Thực vậy: TDecryption = xU = x(kP) = k(xP) = kY = TEncryption 43 Tạp chí Epsilon, Số 10, 08/2016 Đánh giá bảo mật: Để phá khóa được lược đồ này Hacker cần phải tìm được khóa bí mật x hoặc giá trị k bằng cách giải bài toán x = logP Y hoặc k = logP U, và đây là 2 bài toán khó chưa giải được trong thời gian đa thức. Một số thuật toán và giao thức khác sử dụng đường cong Elliptic ứng dụng trong mật mã có thể xem thêm trong [10, 21]. Tài liệu “Guide to Elliptic Curve Cryptography” [19] với rất nhiều thuật toán chi tiết có thể coi là cẩm nang để triển khai cho những bài toán ứng dụng cụ thể của ECC. Tài liệu [1] J. W. Bos, J. A. Halderman, N. Heninger, J. Moore, M. Naehrig, and E. Wustrow, “Elliptic Curve Cryptography in Practice,” Financial Cryptography and Data Security, vol. 8437, pp. 157–175, 2014. [2] J. H. Silverman and J. T. Tate, Rational Points on Elliptic Curves - Second Edition. Springer, 2015. [3] L. C. Washington, Elliptic Curves Number Theory and Cryptography, Second Edition. CRC Press, 2008. [4] J. W. S. Cassels, Lectures on Elliptic Curves. University of Cambridge, 1991. [5] S. Lang, Elliptic Curves Diophantine Analysis. Springer, 1978. [6] C. Kenig, A. Ranicki, and M. Rockner, Elliptic Curves A Computational Approach. Wal ter de Gruyter GmbH & Co., 2003. [7] H. Cohen and G. Frey, Handbook of Elliptic and Hyperelliptic Curve Cryptography. Chapman Hall/CRC, 2006. [8] J. H. Silverman, The Arithmetic of Elliptic Curves. Springer, 2009. [9] L. Berger, G. Bockle, L. D. M. Dimitrov, T. Dokchitser, and J. Voight, Elliptic curves, Hilbert modular forms and Galois deformations. Birkhauser, 2013. [10] I. F. Blake, G. Seroussi, and N. P. Smart, Advances in Elliptic Curve Cryptography. Cam bridge University Press, 2005. [11] I. Connell, Elliptic Curve Handbook. McGill University, 1999. [12] T. H. Otway, Elliptic Hyperbolic Partial Differential Equations. Springer, 2015. [13] Dang Minh Tuan, “Che tao thiet bi VPN IPSec bang phan cung dau tien o Vietnam,” Tap chi CNTT & TT, no. 2, pp. 41–45, 2014. [14] H. Lenstra., “Factoring Integers with Elliptic Curves,” The Annals of Matematics, vol. 126, no. 3, pp. 649–673, 1987. [15] V. S. Miller, “Use of elliptic curves in cryptography,” CRYPTO ’85, pp. 417–428, 1985. 44 Tạp chí Epsilon, Số 10, 08/2016 [16] N. Koblitz, “Elliptic curve cryptosystem,” Math.Comp, vol. 48, no. 16, pp. 203–209, 1987. [17] A. Enge, Elliptic Curves and Their Applications to Cryptography. Kluwer Academic Publishers, 2001. [18] D. Hankerson, J. L. Hernandez, and A. Menezes, “Software Implementation of Elliptic Curve Cryptography over Binary Fields,” CHES2000, vol. 1965, pp. 243–267, 2000. [19] D. Hankerson, A. Menezes, and S. Vanstone, Guide to Elliptic Curve Cryptography. Springer-Verlag, 2004. [20] R. Schoof, “Elliptic Curves Over Finite Fields and the Computation of Square Roots,” Matematics of Computation, pp. 483–495, 1985. [21] I. Blake, G. Seroussi, and N. Smart, Elliptic Curves in Cryptography. Cambridge Uni versity Press, 1999. [22] H. Cohen, A Course in Computational Algebraic Number Theory. Springer-Verlag, 1993. [23] J. M. Pollard, “Monte Carlo Methods for Index Computations (mod p),” Mathematics of Computation, vol. 32, no. 143, pp. 918–924, 1978. [24] S. C. Pohlig and M. E. Hellman, “An Improved Algorithm for Computing Logarithms over GF(p) and its Cryptographic Significance,” IEEE Transactions on Information Theory, vol. 24, pp. 106–110, 1978. [25] A. J. Menezes, T. Okamoto, and S. A. Vanstone, “Reducing elliptic curve logarithms to logarithms in a finite field,” IEEE Trans. Inform. Theory, vol. 39, no. 5, pp. 1639–1646, 1993. [26] C. Research, Standards For Efficient Cryptography, SEC 1: Elliptic Curve Cryptography. Certicom Corp, 2000. [27] L. Gao, S. Shrivastava, and G. E. Sobelman, “Elliptic Curve Scalar Multiplier Design Using FPGAs,” CHES’99, vol. 1717, pp. 257–268, 1999. [28] L. Laurie, M. Alfred, Q. Minghua, S. Jerry, and V. Scott, “An Efficient Protocol for Au thenticated Key Agreement,” Designs Codes and Cryptography, vol. 28, no. 2, 1998. [29] D. Johnson, A. Menezes, and S. Vanstone, “The Elliptic Curve Digital Signature Algo rithm (ECDSA),” 2001. [30] T. E. Gamal, “A Public Key Cryptosystem and a Signature Scheme Based on Discrete Logarithms,” CRYPTO ’84, vol. 196, pp. 10–18, 1985. [31] NIST, Digital Signature Standard (DSS) FIPS 186-4. National Institute of Standards and Technology, 2013. [32] J. Massey and J. Omura, “Method and apparatus for maintaining the privacy of digital messages conveyed by public transmission,” Jan. 28 1986, US Patent 4,567,600. [Online]. Available: https://www.google.com/patents/US4567600 45 Tạp chí Epsilon, Số 10, 08/2016 VẬT LÝ, HÌNH HỌC VÀ TRÁI ĐẤT TRÒN Nguyễn Ái Việt (Viện Công nghệ Thông tin, Đại học Quốc gia Hà Nội) GIỚI THIỆU Nhắc tới chuyện Trái Đất tròn là người ta nghĩ tới các nhà vật lý N.Copernicus, G.Galilei, G.Bruno và thường nghĩ rằng đó là một vấn đề thuộc về vật lý. Thực ra đây là một vấn đề ứng dụng hình học được tìm ra trước đó gần 2000 năm bởi nhà bác học Hy Lạp Erasthonenes. Vì sao nhân loại lại bỏ quên một phát kiến vĩ đại như vậy? Vì sao các nhà bác học Trung Quốc, vẫn chưa bao giờ biết và nghĩ tới việc này cho đến khi bị văn minh phương Tây tràn vào và lấn át. Hình học và Vật lý Thời Hy Lạp cổ, khoa học không phân biệt, chuyên môn hóa như bây giờ. Một nhà bác học thường nghiên cứu các vấn đề Triết học, Toán học, Vật lý, Logic, Ngôn ngữ và các khoa học nhân văn. Các ngành khác nhau, như ta biết bây giờ, chỉ là các vấn đề mà họ quan tâm. Trái với ngày nay, khi đó hình học gắn liền với ứng dụng thực tế thời Hy Lạp cổ là việc đo đất đai. Vật lý là khoa học siêu hình trừu tượng chỉ giành riêng cho các nhà hiền triết lớn nhất giải thích mọi hiện tượng xảy ra trong tự nhiên. Các vấn đề vật lý mà họ bàn luận hết sức xa thực tế như tại sao mũi tên không có người đẩy lại bay được. Khi đó, hình học và vật lý là hai vấn đề khoa học song sinh, cùng nghiên cứu tính chất và quan hệ của các vật thể trong không gian sống của con người. Dần dần, hình học cố gắng thoát ra khỏi các nội dung ứng dụng cụ thể, ngày càng trừu tượng hơn. Điều đó tốt, giúp hình học bớt thiển cận có thể vươn tới những khái niệm hiện hữu nhưng ở bên ngoài suy diễn trực giác của con người. Như thế phạm vi ứng dụng của hình học ngày càng mở rộng. Vật lý phát triển theo chiều ngược lại, cố gắng thoát khỏi tháp ngà siêu hình học, tìm đến với quan sát thực tiễn, để giải thích các hiện tượng tự nhiên có căn cứ hơn. Và cũng như thế, vật lý ngày càng giúp con người hiểu nhiều về bản chất của vũ trụ. Tuy vậy, do việc chuyên môn hóa quá sâu, ngày nay người ta, kể cả các nhà khoa học có chuyên môn sâu, có nhiều ngộ nhận. Họ cho rằng, Hình học là khoa học về những hình thể không tồn tại, chẳng liên quan gì tới thực tiễn. Ngược lại, vật lý là phải gắn liền với số liệu của các quá trình cụ thể. Do đó, chính các nhà khoa học cũng tự băn khoăn, nghiên cứu các khoa học như hình học và vật lý lý thuyết sẽ đem lại điều gì. 46 Tạp chí Epsilon, Số 10, 08/2016 Hình học ở Trung Hoa và Hy Lạp cổ Người ta thường nói các nhà hiền triết Trung Quốc cũng đã tìm ra hình học riêng theo cách của họ. Có người còn gắn Kinh Dịch, tâm linh và các yếu tố siêu hình khác với các tỷ lệ Lỗ Ban quy định cho thợ mộc. Sau hơn 2000 năm, mạc dù phát minh ra rất nhiều điều kinh ngạc, lập được những bản đồ thiên văn đầu tiên của nhân loại, kiến thức hình học của người Trung Quốc vẫn hết sức thô sơ, không tiến gì được thêm so với Lỗ Ban, ở thế kỷ 4 trước Công nguyên. Nói một cách khác, hình học, nếu có ở Trung Quốc thời cổ, chỉ là một dạng tiền thân khoa học hết sức sơ đẳng. Khi đó việc thờ phụng cúng bái các tỷ lệ hình học của Lỗ Ban, cũng như việc các tín đồ của Pythagoras tin rằng nhờ Thượng đế họ mới phát mình được ra định lý về tam giác vuông và phải mổ tới 100 con bò để tạ ơn với hy vọng rằng Thượng đế sẽ cho họ có nhiều định lý khác đẹp đẽ hơn. Chính lòng tin mù quáng và hạn chế với các ứng dụng ngay trước mắt đã làm các hiểu biết về hình học ở Trung Quốc trở nên thiển cận và dẫm chân tại chỗ. Mặc dù các tư duy sơ khai đều có thể chứa đựng rất nhiều minh triết, nhưng chúng vẫn chưa phải là khoa học. Cho đến khi văn minh phương Tây tràn vào, người Á Đông vẫn tin rằng Trái Đất hình vuông, bầu trời hình bán cầu chụp lên mặt đất như một cái lồng bàn, bốn phương có bốn cột chống trời đỡ toàn bộ cái lồng bàn. Một chú bé lớp hai ngày nay cũng có thể đặt rất nhiều câu hỏi làm mô hình vũ trụ quan hình học này đổ sụp. Tôi tin rằng các nhà hiền triết Trung Hoa cũng đã từng đặt ra được các câu hỏi như thế. Nhưng điều gì khiến họ không dám trả lời để thay đổi vũ trụ quan đó? Chúng ta sẽ quay lại vấn đề này sau khi nhìn lại cách nghĩ của các nhà bác học Hy Lạp cổ. Nhà bác học Hy Lạp Erasthostene sống vào thế kỷ 3 trước Công Nguyên, tức là sau Lỗ Ban hơn 200 năm. Ông chỉ dùng suy luận và dựa trên một số dữ liệu quan sát đã biết được Trái đất có hình cầu và tính được chu vi của hình cầu đó một cách chính xác. Đó mới chính là khoa học đích thực. Ý tưởng của Erasthostene khá đơn giản so với hiểu biết của chúng ta ngày nay: Người Hy Lạp, người A rập cổ đã biết chế tạo ra các đồng hồ mặt trời tương đối chính xác dựa trên bóng của các đỉnh tháp khi có mặt trời. Vào thời điểm giữa trưa, bóng của các cọc đóng vuông góc trên mặt đất là ngắn nhất. Nếu giả thiết các tia sáng đến mặt đất đều song song và mặt đất là phẳng, các hình chiếu của các cọc cao như nhau phải giống hệt nhau. Tuy nhiên, Erasthostene nhận thấy hình chiếu của các cọc có cùng độ dài vào giữa trưa tại Syene và Alexandria không giống nhau. Điều đó có nghĩa là các cọc không song song và lập thành một góc nhất định với nhau xấp xỉ 2π 50 . Như vậy, Trái Đất phải là hình cầu có chu vi gấp 50 lần khoảng cách từ Syene đến Alexandria. Bài toán trên có thể giải trong trường hợp các tia sáng không song song và đều xuất phát từ một điểm là Mặt Trời. Tuy nhiên do khoảng cách giữa Mặt Trời vào Trái Đất là quá lớn so với các dữ liệu trong bài toàn, đóng góp của sự sai lệch này không đáng kể. Điều quan trọng ở đây không phải là giải một bài toán mà ở phương pháp suy luận, sáng tạo, trí tưởng tượng và khả năng liên tưởng giữa các khái niệm trừu tượng và thực tế. Các nhà hiều triết Á Đông đi trước, có rất nhiều ưu thế, nhưng thiếu đi những thành phần quan trọng nhất để tạo ra sáng tạo khoa học có tầm cỡ thực sự. Nếu có ai đó vẽ sẵn cho họ các tia sáng, cọc, đường 47 Tạp chí Epsilon, Số 10, 08/2016 dây cung giữa Syene và Alexandria và tâm Trái Đất, các học trò của họ cũng có thể tính toán dễ dàng chu vi của vòng tròn, cho dù họ chưa bao giờ biết đến số π. Điểm quan trọng trong phát kiến vượt thời gian gần 2000 năm so với minh triết phương Đông của Erasthostene là óc tưởng tượng gắn liền với các dữ liệu có thể quan sát được. Dữ liệu quan sát được mới giúp chúng ta "nhìn" thấy những sự vật mà những người minh triết đến đâu cũng không nhìn thấy được. Các giáo điều, giả thiết, định kiến có sẵn sẽ bịt mắt làm các nhà khoa học mù lòa. Nói một cách khác, Erasthostene đã nhìn ra Trái Đất tròn từ các bóng nắng, điều mà các nhà hiền triết Á Đông không thể nào làm được do phương pháp nhận thức của mình. Nghiên cứu hình học không chỉ bao gồm việc suy luận ra các tính chất của các vật thể dựa trên một số tiên đề có sẵn mà còn là việc nhìn thấy được sự hiện hữu của một hình học xác định qua các vật thể và hiện tượng có trong thực tế. Hình học, vật lý và rào cản vô hình Hình học, xây dựng trên những tiên đề cố định, và cố gắng tìm ra những tính chất bất biến với thời gian. Với toán học, một tam giác được giả thiết là được sinh ra cùng với vũ trụ và tồn tại mãi mãi như thế. Các câu hỏi, tại sao một vật lại có hình tam giác, hình thành như thế nào, trước đó là hình gì và trong tương lai sẽ là hình gì, đều được cho là không thuộc phạm vi nghiên cứu của hình học. Hình học như một bức tranh tĩnh, một lát cắt đồng thời gian của các sự vật và đông cứng lại chúng lại để nghiên cứu. Vật lý, người anh em song sinh của hình học là khoa học của vận động, nhờ đến toán học để biết các thuộc tính của sự vật tại mỗi thời điểm, nhưng tìm các quy luật điều khiển vận động, thay đổi của sự vật. Thực ra, hình học có sức mạnh hơn là một trật tự tĩnh. Chính cách nhìn nhận, của nhà khoa học, bị ảnh hưởng không ít bởi môi trường sống, công luận xung quanh, tự hạn chế mình giống như các hiền triết Á Đông thời cổ. Không ít các nhà Toán học lớn như Leibnitz, Gauss, Poincaré, Hilbert, Cartan đã thoát được khỏi những tín điều đó. Leibnitz đã cùng với Newton phát hiện ra tính toán giải tích và xây dựng hệ thống vũ trụ cơ học của Newton. Gauss, Poincaré đã đặt nền tảng cho hệ thống vũ trụ với các hiện tượng điện từ của Maxwell. Hilbert, Cartan đã cùng Einstein xây dựng mô hình thế giới bằng các đa tạp Riemann cho các hiện tượng hấp dẫn. Trong các mô hình vũ trụ quan như thế, hình học trở thành cuốn phim sinh động, mô tả những vụ nổ lớn, sóng lan truyền từ những khoảng cách không thời gian tới hàng tỷ năm ánh sáng. Không có hàng rào nào cản trở sự suy nghĩ, biết các khái niệm trừu tượng thành chuyện giành riêng của một số người, cũng không có hàng rào nào ngăn cách hình học và vật lý. Các tín điều đều là con người tưởng tượng ra để ngăn cấm chính mình. 48 Tạp chí Epsilon, Số 10, 08/2016 Ý nghĩa thực tiễn của hình học và vật lý Ngày nay, nhân loại đang đứng trước những phát kiến lớn lao với những quan sát mới về sóng hấp dẫn, vật chất tối, lực thứ năm hứa hẹn một cuộc cách mạng mới về khoa học công nghệ. Có những người và những dân tộc sẽ trở nên hùng cường, có những người và những dân tộc sẽ lỡ chuyến tàu lịch sử bởi không chịu từ bỏ thói quen suy nghĩ của chính mình. Khoa học công nghệ không thể phát triển dựa trên một động lực ứng dụng thiển cận vào những khái niệm có sẵn và cố định xung quanh ta. Có lẽ động lực tìm đến các khái niệm mới quan trọng hơn chính bản thân nội dung các phát kiến khoa học. Trong khi đó, như một tất yếu, mặc dù không phải là động lực ban đầu, khoa học luôn mang đến những công nghệ mới. Khi sóng điện từ được tìm ra từ lời giải của phương trình Maxwell, không ai nghĩ được có một ngày, sóng vô tuyến truyền hình, Internet, điện thoại di động lại tràn ngập không gian sống của chúng ta như ngày nay. Công thức năng lượng E = mc2của lý thuyết tương đối đem lại nguồn năng lượng khổng lồ cho nhân loại. Phương trình Schrodinger và các ¨ hệ thức giao hoán ma trận của Heisenberg mở đầu công nghệ vật liệu mới, bán dẫn và các linh kiện điện tử mở ra cuộc cách mạng về công nghệ thông tin. Nói về thành tựu do khoa học đúnng nghĩa đem lại, chúng ta cũng không bao giờ quên những vật cản đường do chính chúng ta tạo ra là hệ quả của thói quen cổ hủ, định kiến sai lầm, thực dụng thiển cận. Chúng ta đã thấy bài học của khoa học thời cổ ở Á Đông. Để kết thúc tôi xin nhắc lại một câu chuyện để nói lên cách suy nghĩ thực dụng thiển cận có thể gây nên một sai lầm quyết định vận mệnh của cả một dân tộc như thế nào. Trước chiến tranh thế giới lần thứ 2, nước Đức là trung tâm của khoa học thế giới, nơi phát minh ra Cơ học Lượng tử và Thuyết tương đối. Về mặt công nghệ, nước Đức đi đầu và hoàn toàn sẵn sàng chế tạo thành công bom nguyên tử. Do chính sách của Hitler, rất nhiều nhà khoa học giỏi đã rời khỏi Đức, do không muốn hợp tác với chính quyền phát xít. Với lực lượng còn lại, nước Đức vẫn đủ khả năng làm ra bom nguyên tử trước Mỹ và Liên Xô. Tuy nhiên, Hitler đã ban hành một chính sách là mọi nghiên cứu khoa học phải có kết quả thực tiễn trong vòng 6 tháng. Chính điều đó làm nước Đức không thể chế tạo bom nguyên tử vì không đủ các nghiên cứu cơ bản cần thiết. Có thể đó là một may mắn cho nhân loại, nhưng không hề ngẫu nhiên. Một sự ngu dốt về chính sách cũng chỉ là hệ quả tất yếu của cách nghĩ phát xít mà thôi. Độc tài, phân biệt chủng tộc bao giờ cũng sẽ tự kìm hãm chính mình. Chính vì thế mà nhân loại còn tồn tại. Bạn nghĩ sao nếu Lỗ Ban cũng tìm ra được Trái Đất hình cầu như Erasthostene, hình học Euclide được tìm ra và cách mạng cơ khí nổ ra tại Trung Quốc? Với cách nghĩ Á Đông, cho dù có những kiến thức khoa học vĩ đại nhất, liệu có phải là may mắn hơn cho nhân loại hay không? 49 Tạp chí Epsilon, Số 10, 08/2016 SỐT MAYONNAISE VÀ BẦU CỬ TỔNG THỐNG MỸ Nils Berglund (Đại học Orleans, Cộng hòa Pháp) Người dịch: Dương Đức Lâm (Đại học Sussex, Vương quốc Anh) LỜI NGƯỜI DỊCH Nils Berglund là giáo sư toán học của Đại học Orléans, Pháp. Lĩnh vực nghiên cứu chính của ông là vật lý toán, lí thuyết hệ động lực và lí thuyết xác suất. Ngoài chuyên môn ông còn có sở thích trượt tuyết và nấu ăn. Ông cũng có khá nhiều bài viết phổ biến khoa học, một số đăng trên các tạp chí, website khoa học của Pháp, điển hình là Images des Mathématiques. Bài viết sau đây được dịch từ nguyên bản tiếng Pháp "Mayonnaise et élections américaines" đã đăng trên tạp chí Dossier Pour La Science số 91, tháng 4 - 6 năm 2016. Bản dịch đã được sự cho phép của tác giả. Một số thuật ngữ, do chưa được dịch ra tiếng Việt một cách thống nhất, hoặc để cho độc giả có thể tìm hiểu rõ hơn, chúng tôi chú thích thêm dưới dạng tiếng Anh. Tất cả các chú thích là của người dịch. Chắc hẳn là bạn đã biết đến phương trình vi phân, nhưng liệu bạn có biết phương trình vi phân đạo hàm riêng ngẫu nhiên? Có nguồn gốc từ những vấn đề sống động quanh ta, chúng rất hữu ích cho việc nghiên cứu các hiện tượng khác nhau trong tự nhiên cũng như trong chính xã hội loài người. Nó là lĩnh vực nghiên cứu trung tâm dẫn đến giải thưởng Fields của một nhà toán học năm 2014. Hãy bắt đầu với hai bài toán thực tế sau đây. Trộn lẫn một hỗn hợp dầu ăn với nước, quan sát (với các công cụ hỗ trợ tùy ý theo lựa chọn của bạn) sự lắng đọng của các phân tử trên bề mặt, và so sánh nó với trò chơi xếp hình Tetris1. Theo dõi sự thay đổi quan điểm chính trị của người Mỹ trong tiến trình của cuộc bầu cử tổng thống sẽ diễn ra vào tháng 11 năm nay. Thật ngạc nhiên là để hiểu được những hiện tượng khác nhau từ những nguồn gốc rất khác nhau như thế, chúng ta lại cần đến sự hỗ trợ của cùng một công cụ toán học. Đó là phương trình đạo hàm riêng ngẫu nhiên (được kí hiệu là SPDE2), một công cụ toán học mà đã trở nên hiệu quả hơn rất nhiều nhờ các nghiên cứu gần đây của Martin Hairer, Giáo sư Đại học Warwick, Vương quốc Anh. Với những đóng góp quan trọng đó, ông được trao tặng Huy chương Fields danh giá năm 2014. Vậy SPDE là gì? Điểm khác nhau căn bản giữa SPDE với phương trình vi phân thường là ở chỗ, SPDE được áp dụng cho các hệ mô hình toán học có chiều vô hạn với một đại lượng được gọi là tiếng ồn3(hay các nhiễu loạn ngẫu nhiên). Nhờ đó chúng ta có thể nghiên cứu các tình huống phức tạp nơi có sự tương tác, giao thoa của rất nhiều yếu tố, như các bọt dầu, các phân tử vật chất hay những 1Một trò chơi điện tử rất phổ biến từ cuối những năm 90 của thế kỉ XX 2Stochastic Partial Differential Equations 3noise 50 Tạp chí Epsilon, Số 10, 08/2016 Hình 1: Sự phát triển quan điểm chính trị của người dân Mỹ có thể được mô tả bởi phương trình đạo hàm riêng ngẫu nhiên! người Mỹ! Chúng ta sẽ cùng vén bức màn bí mật về các phương trình này, cũng như không quên tìm hiểu những tiến bộ quan trọng nào trong các công trình của Martin Hairer đã đưa đến cho ông ấy một giải thưởng tương đương với giải Nobel. Nhưng trước khi bắt đầu, hãy cầm lấy ngọn đuốc của bạn! Đốt nóng một thanh kim loại một cách không đồng đều, tức là chỉ đốt ở một số chỗ nhất định trên thanh. Làm thế nào để xác định được nhiệt độ ở một vị trí nào đó của thanh kim loại theo thời gian? Chúng ta có thể trả lời câu hỏi này nhờ lí thuyết phương trình truyền nhiệt (xem Phụ lục 1 ở cuối bài viết), được giới thiệu bởi Joseph Fourier vào năm 1811. Biến trong phương trình truyền nhiệt là hàm T(x, t), mô tả nhiệt độ tại điểm x và ở thời gian t. Đây là một phương trình vi phân đạo hàm riêng, nó biểu thị sự phụ thuộc của các thông số về sự biến thiên theo không gian và theo thời gian của nhiệt độ. Người ta đã biết cách giải phương trình này, và do đó dự đoán, biết được sự phân bố nhiệt độ tại thời điểm ban đầu T(x, 0), nhiệt độ tại bất kì điểm nào cũng như tại bất kì thời gian nào sau đó. Đốt nóng thanh kim loại Phương trình truyền nhiệt có hai tính chất quan trọng. Tính chất thứ nhất, nguyên lí chồng chất nghiệm4, nói rằng nếu ta biết được các nghiệm mô tả sự phân bố nhiệt độ của thanh kim loại cho bởi hai nguồn nhiệt khác nhau, chẳng hạn đốt nóng thanh tại điểm x hoặc ở điểm y, thì ta cũng biết được nghiệm mô tả sự phân bố nhiệt độ của nó khi đốt nóng thanh cùng lúc tại hai điểm x và y. Nghiệm này chỉ đơn giản là nhận được bằng cách cộng hai nghiệm trước đó với nhau. Tính chất thứ hai nói rằng phương trình truyền nhiệt có tính chính quy5. Giả sử sự phân bố nhiệt độ ban đầu rất khác nhau, chẳng hạn, đặt nửa trái của thanh kim loại vào lò nung ở 1000 độ C (rồi bỏ ra), còn nửa phải ở nhiệt độ phòng. Thế thì gần như ngay lập tức, nhiệt độ ở nửa trái sẽ lan truyền một cách đều đặn và liên tục ra toàn bộ thanh cho đến khi toàn bộ thanh đạt được một nhiệt độ ổn định6. 4superposition principle 5regularity, hay tính trơn 6nói cách khác, ngay sau khi bỏ thanh kim loại ra khỏi lò, đồ thị nhiệt độ trong thanh là một hàm liên tục 51 Tạp chí Epsilon, Số 10, 08/2016 Chúng ta cũng mô tả được sự truyền nhiệt trong các đối tượng phức tạp hơn, khi thay thanh kim loại bởi một tấm kim loại hình chữ nhật, hình đĩa, hay một khối kim loại hình lập phương. Với những hình khối tổng quát hơn, mặc dù không phải lúc nào ta cũng tìm được nghiệm một cách chính xác, nhưng nguyên lí chồng chất nghiệm và tính chính quy thì vẫn luôn đúng cho mọi trường hợp. Một sự tổng quát khả dĩ khác cho phương trình truyền nhiệt là khi thanh kim loại được tiếp tục cung cấp một nguồn nhiệt thay đổi theo thời gian, ta có phương trình truyền nhiệt cưỡng bức7 (còn gọi là bài toán không thuần nhất). Lúc này nghiệm của bài toán nhận được nhờ áp dụng nguyên lí Duhamel, nói rằng nghiệm ở thời điểm t có thể viết như một sự chồng chất nghiệm của các thời điểm trước đó. Món sốt mayonnaise thất bại và bề mặt lượn sóng của tấm tôn Có nhiều phương trình đạo hàm riêng có dạng tương tự như phương trình truyền nhiệt, nhưng chứa thêm một số đại lượng khác làm cho việc nghiên cứu chúng trở nên khó khăn hơn rất nhiều. Một ví dụ điển hình là phương trình Allen - Cahn, mô phỏng hiện tượng tách pha8. Khi trộn một hỗn hợp nước với dầu ăn vào một cái bình thủy tinh và lắc mạnh, ta nhận được một thể nhũ: chúng không thể trộn lẫn hoàn toàn vào nhau, mà hình thành những giọt nhỏ li ti dầu và nước có thể quan sát thấy qua kính lúp. Nguyên lí tương tự cũng xảy ra với nước sốt mayonnaise, một hỗn hợp nhũ tương của dầu ăn và dấm được kết dính với nhau bằng lòng đỏ trứng gà. Thiếu thành phần cuối cùng này (hoặc một thành phần có vai trò tương đương), thì dù bạn có cố gắng cách mấy, các giọt li ti dầu ăn và giấm cũng sẽ tụ họp dần dần thành hai lớp khác nhau! Đó là sự tách pha. Hiện tượng tương tự cũng được quan sát thấy trong một số loại hợp kim. Để mô hình hóa hiện tượng này, hãy tưởng tượng có một chuỗi hạt cườm được nối với nhau bởi những chiếc lò xo. Đặt ngang chuỗi hạt lên trên một tấm tôn lượn sóng gồm hai rãnh song song cách nhau bởi phần chõm nhô lên cao ở giữa (xem Hình 2). Dưới tác dụng của trọng lực, mỗi hạt cườm đều có xu hướng lăn xuống đáy một trong hai rãnh. Tuy nhiên vì có sợi lò xo, các hạt lân cận hạt đó cũng có xu hướng bị kéo xuống rãnh theo. Các tương tác này là một sự mô phỏng tương tự cho hỗn hợp nhũ tương ở trên khi chúng tách thành hai phần dầu ăn và dấm, và xu hướng chuyển động của các phân tử của hai chất lỏng bao quanh các phân tử cùng loại9. Bây giờ lấy các chuỗi với số hạt cườm tăng dần còn lò xo thì ngắn dần10. Tại điểm tới hạn, chuỗi hạt có thể được đặc trưng bởi một hàm Y (x, t), cho biết sự chuyển dịch ngang của chuỗi tại điểm x và tại thời gian t. Giả sử hai rãnh tương ứng với Y = 1 và Y = −1, trong khi phần chõm là Y = 0. Người ta chứng minh được rằng sự chuyển dịch ngang này tuân theo một phương 7forced 8phase separation 9Bạn đọc có thể xem một minh họa thú vị cho hiện tượng này ở đây https://www.youtube. com/watch?v=NDQHepkSeS8 10đương nhiên kích thước hạt sẽ phải bé dần 52 Tạp chí Epsilon, Số 10, 08/2016 Hình 2: Chuỗi hạt cườm và mayonnaise. Các hạt gắn với nhau bởi lò xo có thể chuyển động tự do theo phương y nhưng bị cố định theo phương x với một khoảng cách đều nhau (a). Khi chiều dài lo xo ngắn lại, ngắn hơn khoảng cách nhỏ nhất giữa các hạt, chúng sẽ có xu hướng xếp thành hàng (đường nét đứt). Đặt chuỗi hạt này lên một tấm tôn (b). Mỗi hạt cườm sẽ bị thu hút bởi các hạt lân cận của nó và bởi rãnh tấm tôn. Khi số hạt tăng lên vô hạn, sự chuyển động của chuỗi hạt được mô tả bởi phương trình Allen - Cahn một chiều. trình đạo hàm riêng, nhận được bằng cách thêm vào phương trình truyền nhiệt một đại lượng Y − Y3, biểu thị cho hiệu ứng đẩy các hạt về một trong hai rãnh. Phương trình này được đưa ra vào năm 1972 một cách độc lập bởi hai nhóm nghiên cứu, một nhóm gồm Nathaniel Chafee và Ettore Infante, nhóm kia là John Allen và Sam Cahn (xem Phụ lục 2). Khác với phương trình truyền nhiệt, phương trình Allen - Cahn không có nghiệm hiển, cũng không thỏa mãn nguyên lí chồng chất nghiệm. Nguyên nhân là bởi có sự xuất hiện của đại lượng phi tuyến Y3. Tuy vậy, ta có thể xây dựng được một nghiệm của nó bằng phương pháp xấp xỉ liên tiếp. Trước hết, hãy tạm quên đi đại lượng Y − Y3 để trở về với phương trình truyền nhiệt, và gọi nghiệm của nó là Y0. Ý tưởng là sau đó thay thế đại lượng Y − Y3 bởi Y0 − Y30 và nhận được một phương trình truyền nhiệt không thuần nhất mà ta đã biết cách giải. Gọi nghiệm của nó là Y1, lại thay thế đại lượng trên bởi Y1 − Y31, và cứ tiếp tục như thế, với hi vọng rằng chúng ta sẽ tiến một cách từ từ đến nghiệm chính xác của phương trình. Và điều này thực tế là đúng, thật vậy, phương pháp này chẳng qua là một biến thể của phép lặp Picard, nó cung cấp một con đường để tìm nghiệm của phương trình Allen - Cahn và vẫn hoạt động rất tốt trong trường hợp số chiều tăng lên (xem Hình 3). Nhắc lại rằng, phép lặp Picard là một phương pháp giải phương trình vi phân bằng các phép xấp xỉ liên tiếp, càng nhiều phép lặp càng chính xác. Thực tế quy trình này thường được sử dụng để chứng minh sự tồn tại nghiệm của một phương trình vi phân hay phương trình đạo hàm riêng cụ thể nào đó. Trong mô hình tách pha, chúng ta cũng có thể quan tâm đến sự biến đổi của kích cỡ các nhóm phân tử cùng loại theo thời gian, và các mặt phân cách11 giữa chúng (xem Hình 4). Các hiện tượng tương tự như sự tách pha cũng được quan sát thấy trong các mô hình nam châm hay các mô hình về sinh thái (chẳng hạn mô tả sự hình thành các vết vằn hay lốm đốm trên lông động vật trong quá trình chúng lớn lên). Thêm một chút tưởng tượng, chúng ta thậm chí nhìn thấy điều tương tự trong một hệ mô tả sự phát triển của các quan điểm cá nhân. Xét một đất 11interface 53 Tạp chí Epsilon, Số 10, 08/2016 Hình 3: Sự tách pha. Chúng ta có thể mô phỏng hiện tượng này với một "thảm" hạt cườm được sắp xếp theo một mạng lưới ô vuông, liên kết với nhau bởi các lò xo (a). Chúng có thể chuyển động vuông góc với mặt phẳng. Sự tiến hóa của hệ này (b) được cho bởi nghiệm của phương trình Allen - Cahn ngẫu nhiên hai chiều, giải thích hiện tượng tách pha. Vùng màu đỏ và xam lam tương ứng với các pha nguyên chất (dầu ăn hoặc dấm), các vùng màu cam, vàng hoặc xanh lá cây là các vùng trộn lẫn với tỉ lệ khác nhau giữa hai pha. Bốn hình ảnh mô tả trạng thái của hệ sau 10, 50, 100 và 300 đơn vị thời gian. nước có hai đảng đối lập, ví dụ nước Mỹ. Những điểm xanh và những điểm đỏ tượng trưng cho một cách tương ứng những người tin vào Đảng Dân chủ và tin vào Đảng Cộng hòa, những điểm có màu trung gian tượng trưng cho những người chưa quyết định sẽ theo bên nào, với một thiên hướng mạnh hay yếu hướng đến một trong hai đảng. Chúng ta giả sử ở đây rằng mỗi người dân bị ảnh hưởng bởi những người hàng xóm của họ, và do đó hình thành những vùng mà trong đó mọi người cùng chia sẻ một quan điểm chính trị. Vậy phe nào sẽ chiến thắng trong cuộc bầu chọn tổng thống sắp tới? Câu trả lời sẽ có vào tháng 11 này12! Tình huống trong hệ của chúng ta sẽ phức tạp hơn một chút khi thêm một đại lượng ngoại lực ngẫu nhiên (nhiễu loạn) vào phương trình. Đó là kết quả của chẳng hạn sự chuyển động nhiệt của các phân tử không khí bao quanh các hạt cườm trong chuỗi. Khi các phân tử khí tác động qua lại với nhau, ta có thể mô tả tương tác giữa chúng bằng một khái niệm gọi là tiếng ồn trắng thời gian13, mà tác động của nó tới hệ tại những thời điểm khác nhau là độc lập với nhau. Khi ta đi đến một giá trị tới hạn mà số hạt trên chuỗi tiến ra vô cùng, tiếng ồn trắng khi đó trở thành tiếng ồn trắng không-thời gian14. Nó tác động một cách độc lập tại những thời điểm và vị trí khác nhau. Chúng ta vì vậy đang đối mặt một SPDE, vì đã thêm vào một đại lượng tương ứng với tiếng ồn để mô tả một hệ vô hạn: đó là phương trình Allen - Cahn ngẫu nhiên. Chúng ta sẽ thấy rằng tiếng ồn này, hoàn toàn không chính quy15 trong các điều kiện của ta, đã cản trở việc tìm nghiệm của phương trình khi chiều lớn hơn hay bằng 2. 12Một ví dụ minh hoạ rõ nét khác và vẫn còn nóng hổi là cuộc trưng cầu dân ý về việc ở lại hay rời liên minh châu Âu của người Anh ngày 23 tháng 6 vừa rồi. Sau khi có kết quả kiểm phiếu với chiến thắng cho phe Brexit, rất nhiều người dân tỏ ra hối hận vì đã để lá phiếu của họ bị ảnh hưởng bởi những người xung quanh! 13temporal white noise 14spatiotemporal white noise 15highly irregular 54 Tạp chí Epsilon, Số 10, 08/2016 Hình 4: Bài toán sự tách pha từ mô hình các hạt cườm nảy sinh nhiều câu hỏi thú vị. Hình dạng, kích thước của các nhóm hạt cùng loại (tức các vùng cùng màu) thay đổi như thế nào theo thời gian? Liệu mặt phân cách giữa các nhóm cuối cùng có biến mất? Có thể mô tả được chuyển động của các bề mặt phân cách này theo thời gian? Lược đồ không-thời gian sẽ cho một câu trả lời. Không gian là bề ngang, thời gian là bề dọc từ cao xuống thấp. Các vị trí hạt cườm được đánh dấu bởi màu sắc như trên hình. Tại các điểm trên các phần "mõm" nhô ra sẽ xảy ra xung đột giữa các mặt phân cách, kéo theo sự biến mất dần của chúng. Tetris và mặt phân cách Một ví dụ khác về SPDE là khi ta phun các phân tử lên một vật chất nền, được sử dụng chẳng hạn trong công nghệ chế tạo vật liệu bằng kĩ thuật epitaxy16 cho các thiết bị điện tử. Để mô hình hóa quá trình này, hãy bắt đầu nguồn cảm hứng từ một dạng biến thể của nó là trò chơi Tetris. Xét trong không gian một chiều với một vật thể làm nền đặt nằm ngang cho trước. Các phân tử tạm coi là những hình vuông nhỏ, rơi thẳng từ một vị trí ngẫu nhiên từ trên xuống. Quy luật là khi hình vuông chạm vào nền, hoặc chạm vào một hình vuông khác bên cạnh hay bên dưới nó, nó sẽ không di chuyển được nữa. Tuy nhiên, các hình vuông có thể, với một xác suất nhỏ, di chuyển sang hai bên một khi nó xuất hiện. Câu hỏi là, làm thế nào biết được mức độ gồ ghề trên bề mặt của các vật liệu được sản xuất như vậy? (Xem Hình 5). Vào năm 1986, Mehran Kardar, Giorgio Parisi và Yi-Cheng Zhang đã thiết lập được một SPDE mô tả quá trình tới hạn nhận được khi kích cỡ hình vuông tiến dần về 0 (xem Phụ lục 2). Phương trình này, được kí hiệu là KPZ, từ chữ cái đầu của tên ba tác giả, chứa các đại lượng của phương trình truyền nhiệt, mô tả sự chuyển động của các phân tử phun vào, cũng như một tiếng ồn trắng không-thời gian và một đại lượng phi tuyến đặc trưng bởi hình dạng của bề mặt nền phân cách. Thật không may, phương trình này lại không đặt chỉnh17 do tính không chính quy của đại lượng tiếng ồn, và cho đến gần đây chúng ta đã không thể đưa ra được một lời giải có ý nghĩa toán học nào cho nó. Để hiểu được bài toán, chúng ta phải lượng hóa tính không chính quy của các đại lượng có trong phương trình. Chúng ta có thể liên kết mỗi hàm f với một số r mà càng lớn khi hàm càng trơn. 16tạm dịch là kĩ thuật cấy ghép, một kĩ thuật cho phép chế tạo màng mỏng đơn tinh thể có độ tinh khiết rất cao, thực hiện trong môi trường chân không siêu cao, được phát minh vào những năm 60 của thế kỉ XX 17ill-posed 55 Tạp chí Epsilon, Số 10, 08/2016 Hình 5: Một sự đơn giản hóa của trò chơi Tetris. Việc phun các phân tử lên bề mặt vật liệu nền có thể mô hình hóa bởi một quá trình tăng trưởng ngẫu nhiên. Ở đó các phân tử được biểu diễn bởi các hạt hình vuông rơi xuống một vị trí ngẫu nhiên trên mặt phẳng nằm ngang, tương tự trò chơi Tetris. Mỗi hạt sẽ dừng lại khi nó chạm vào hạt khác. Hơn nữa, các hạt ở trên cao có thể di chuyển sang hai bên với một xác suất nhỏ. Độ thô ráp của bề mặt tăng lên khi xác suất này giảm xuống: bề mặt ở hình (a) thô hơn hình (b). Nếu đồ thị của hàm số có tiếp tuyến tại mọi điểm thì r lớn hơn hoặc bằng 1. Hơn nữa nếu tại mọi điểm của f ta đều xác định được một độ cong, thì r ít nhất bằng 2. Nếu f chính quy bậc r, thì các đạo hàm riêng của f chính quy bậc r − 1. Một cách ngược lại, nghiệm của phương trình truyền nhiệt cưỡng bức bởi f có bậc chính quy cao hơn r. Phương trình không đặt chỉnh Bậc chính quy r không nhất thiết phải là một số nguyên. Chẳng hạn chuyển động Brown, mô tả quỹ đạo hỗn loạn của một hạt phấn hoa giữa những hạt khác trong nước, có bậc chính quy nhỏ hơn 1/2 một chút18. Các quỹ đạo của chuyển động Brown là không khả vi (chúng không có tiếp tuyến tại bất cứ điểm nào). Tuy nhiên, người ta có thể định nghĩa đạo hàm của chúng theo nghĩa phân phối. Phân phối19, một đối tượng tổng quát hơn hàm số, là một lí thuyết được phát triển vào nửa đầu thế kỉ XX bởi các nhà toán học Jacques Hadamard, Salomon Bocher, Sergei Sobolev và Laurent Schwartz. Thay vì xác định giá trị của phân phối tại một điểm cụ thể, ta xác định giá trị trung bình của nó trong một lân cận nhỏ xung quanh điểm nó. Một số toán tử đại số được định nghĩa 18thực tế thì có thể xem nó là một số tùy ý nhỏ hơn và gần bằng 1/2 19distribution, còn gọi là hàm suy rộng 56 Tạp chí Epsilon, Số 10, 08/2016 trên hàm phân phối: chúng ta có thể chẳng hạn thực hiện phép cộng và phép lấy đạo hàm chúng. Tuy nhiên, nhìn chung ta không thể thực hiện phép nhân hai phân phối. Tiếng ồn trắng thời gian có thể xem như đạo hàm theo nghĩa phân phối của một quỹ đạo Brown, với bậc chính quy hơi bé hơn một chút so với −1/2 (chúng ta sẽ coi rằng giá trị này gần như bằng −1/2). Tiếng ồn trắng không-thời gian, trong khi đó, có bậc chính quy phụ thuộc vào chiều của không gian. Giá trị này xấp xỉ −3/2 trong không gian một chiều, xấp xỉ −2 trong không gian hai chiều, và xấp xỉ −5/2 trong không gian ba chiều. Đây là nơi chúng ta sẽ tìm ra lời giải của bài toán. Thật vậy, chúng ta chứng minh được rằng nghiệm Y0 của phương trình truyền nhiệt cưỡng bức bởi một tiếng ồn trắng có bậc chính quy lớn hơn 2 đơn vị, cụ thể là xấp xỉ 1/2, xấp xỉ 0 hoặc xấp xỉ −1/2 tùy theo số chiều của không gian. Quá trình lặp Picard áp dụng cho phương trình Allen - Cahn yêu cầu tính toán, ở bước thứ hai, đại lượng Y0 − Y30. Trong không gian chiều 1, Y0 có bậc chính quy dương, vấn đề không đáng ngại. Với không gian chiều 2 hoặc 3, Y0 lúc này là một phân phối từ việc nó có bậc chính quy âm. Như chúng ta đã biết, không thể thực hiện phép nhân các phân phối, đại lượng Y30trở nên vô định, và quá trình lặp do đó không thể thực hiện được. Phương trình KPZ, cũng vậy, chứa bình phương đạo hàm của Y0. Đạo hàm này có bậc chính quy âm thậm chí với chiều không gian 1, phép lặp Picard không thể áp dụng cho phương trình KPZ. Tái chuẩn hóa và lí thuyết cấu trúc chính quy Đến lúc này, chúng ta có thể tự hỏi rằng liệu có thực sự nên đâm đầu vào các bài toán SPDE không đặt chỉnh như vậy? Thực tế, trong hai ví dụ mà ta đã thảo luận, chúng ta đã bắt đầu với một mô hình rời rạc với một số hữu hạn các đối tượng (các hạt cườm hay các hình vuông), chúng đương nhiên là hoàn toàn xác định. Vấn đề chỉ xuất hiện khi ta chuyển qua giới hạn khi cho kích thước của các đối tượng này tiến dần một cách liên tục về 0. Tuy nhiên ta sẽ thấy rằng việc đâm đầu vào nó là không vô ích, và lí do cho những việc làm này của chúng ta đến từ khái niệm về tính phổ quát. Mô hình rời rạc của sự phát triển của bề mặt phân giới là một trường hợp đặc biệt giữa rất nhiều mô hình có thể có. Chúng ta tuy vậy biết rằng một lượng lớn các mô hình này bị điều chỉnh, trong diện rộng, bởi phương trình KPZ. Đây chính là một đặc tính phổ quát, và sự hiểu biết về nó sẽ làm sáng tỏ cùng một lúc toàn bộ các mô hình cùng loại. Bài toán giới hạn liên tục đã và đang xuất hiện trong vật lý lượng tử, nơi nó được gọi là sự phân kì tia tử ngoại20. Thực tế, phương trình Allen - Cahn tương đương một cách hình thức với một mô hình của lí thuyết trường, gọi là mô hình Φ4. Từ những năm 1930, các nhà vật lý đã đề xuất việc giải bài toán này bằng một phương pháp gọi là tái chuẩn hóa21. Ý tưởng là đưa vào các tham số của lí thuyết tỉ lệ22 mà trên đó hệ có thể quan sát được. 20ultraviolet, còn gọi là tia cực tím, hay tia UV 21renormalization 22scaling theory 57 Tạp chí Epsilon, Số 10, 08/2016 Trong trường hợp phương trình Allen - Cahn, phương pháp này là làm cho phần sườn giữa chõm và rãnh tấm tôn ngày càng dốc khi khoảng cách giữa các hạt cườm giảm dần (xem Hình 2). Với sự lựa chọn thích hợp độ cong của phần chõm, ta nhận được một phương trình đặt chỉnh23 tại trường hợp tới hạn. Điều lấn cấn duy nhất còn lại của quy trình này là nó được thiết đặt hoàn toàn dựa trên các tính toán hình thức mà không có một lập luận toán học chính xác nào. Tuy nhiên, vào năm 1997, Lorenzo Bertini và Giambattista Giacomin, bằng việc sử dụng phép đổi biến rất khéo léo, đã đạt được một kết quả chứng minh sự hội tụ của mô hình sự phát triển của bề mặt phân cách đến một dạng tái chuẩn hóa của phương trình KPZ. Sau đó, vào năm 2003, Giuseppe da Prato và Arnaud Debussche đã có thể chứng minh được sự tồn tại nghiệm cho phương trình Allen - Cahn tái chuẩn hóa hai chiều. Chỉ còn một khiếm khuyết duy nhất, các kĩ thuật này không sử dụng được nữa trong không gian chiều ba. Đóng góp quan trọng của Martin Hairer là phát triển một lí thuyết cho phép xử lí một cách có hệ thống một lượng lớn SPDE cổ điển không đặt chỉnh. Nó không những cho phép tìm lại các kết quả đã biết cho phương trình KPZ và phương trình Allen - Cahn hai chiều, mà còn áp dụng được cho phương trình Allen - Cahn ba chiều và nhiều phương trình khác. Khái niệm trung tâm của lý thuyết này là cấu trúc chính quy24. Cùng với phương pháp tái chuẩn hóa, nó cho phép xây dựng một không gian mà trong đó các phép lặp Picard vẫn hoạt động tốt. Nét đẹp cũng như sức mạnh của lí thuyết là nó cung cấp một lược đồ tổng quát, cho phép xử lí một cách có hệ thống các phương trình thay vì tìm kiếm từng lời giải riêng rẽ. Lí thuyết này là một trong những bước tiến quan trọng hướng tới việc chứng minh một số bài toán mở liên quan đến tính phổ quát, và chúng ta có thể hi vọng vào những tiến bộ mạnh mẽ hơn trong tương lai. Phụ lục 1 Phương trình truyền nhiệt. Nhiệt độ T(x, t) tại điểm x và thời gian t của thanh kim loại được xác định bởi phương trình ∂T/∂t = D∂2T/∂x2 ở đó D là hệ số dẫn nhiệt. Trong phương trình này, số hạng bên trái, đạo hàm riêng của hàm nhiệt độ T đối với biến thời gian t (khi xem x như hằng số), mô tả tốc độ biến đổi của nhiệt độ. Số hạng bên phải, đạo hàm riêng cấp hai của hàm nhiệt độ đối với biến không gian, đặc trưng cho tính không đồng nhất của vật liệu. Hàm G(x, t) = e−x2/4DT /√4πDt là một nghiệm riêng của phương trình, với việc lí tưởng hóa thanh kim loại dài vô hạn. Khi cố định thời gian, G là một đường cong Gauss có dạng hình chuông, một đối tượng đóng một vai trò nền tảng trong lí thuyết xác suất. Bề rộng của chuông, tỉ lệ với √Dt, tăng lên theo thời gian, nhưng bằng 0 tại 0. Nghiệm này cho ta biết rằng, nhiệt độ ban đầu bằng 0 ở mọi nơi trừ điểm 0, điểm nguồn nơi mà thanh kim loại được tiếp xúc nguồn nhiệt. Nếu điểm nguồn là một điểm y nào đó, thì nghiệm sẽ được cho bởi G(x − y, t). Nguyên lí chồng chất nghiệm, một tính chất của phương trình truyền nhiệt, chỉ ra rằng nghiệm tổng quát của phương trình truyền nhiệt viết được dưới dạng T(x, t) = RG(x − y, t)T(y, 0)dy. 23well-posed 24regularity structure 58 Tạp chí Epsilon, Số 10, 08/2016 Nếu thay thanh kim loại bởi một đĩa kim loại hai chiều, hàm nhiệt độ sẽ là T(x, y, t) với hai biến tọa độ không gian x và y và biến thời gian t. Phương trình lúc này có dạng ∂T/∂t = D∆T với ∆T là tổng đạo hàm riêng cấp hai của T đối với x và y (toán tử Laplace). Phương trình nhiệt ba chiều có dạng tương tự, với ba tọa độ không gian. Một tính chất khác của phương trình truyền nhiệt là tính chính quy (xem Hình 6). Hình 6: Sự lan truyền đều đặn của nhiệt độ. Ban đầu, nhiệt độ nửa trái thanh sắt đang ở mức cao (màu đỏ), trong khi nửa phải đang ở nhiệt độ phòng. Sai khác này mất dần khi nhiệt độ lan dần ra toàn thanh, và không có bước nhảy nhiệt độ trong thanh trừ thời điểm ban đầu. 2 Phương trình Allen - Cahn và phương trình KPZ. Phương trình Allen - Cahn ngẫu nhiên mô tả sự tách pha có thể viết dưới dạng ∂Y/∂t = D∆Y +Y −Y3 +ξ. Ở đây ∆Y biểu thị liên kết giữa mỗi hạt cườm với các hạt lân cận với nó thông qua lò xo. Đại lượng Y − Y3 đặc trưng cho lực tổng hợp giữa trọng trường và phản lực của tấm tôn, là nguyên nhân làm cho hạt cườm có xu hướng chạy về các vị trí Y = 1 và Y = −1. Số hạng cuối cùng ξ mô tả tiếng ồn trắng không-thời gian, một ngoại lực ngẫu nhiên mà sự tác động của nó tại các thời điểm và vị trí khác nhau tới phương trình là độc lập với nhau. Phương trình KPZ mô tả sự phát triển của một bề mặt phân cách, đặc trưng bởi hàm cao độ của nó h(x, t) tại điểm x và thời gian t, có dạng ∂h/∂t = D∂2h/∂x2+(1/2)(∂h/∂x)2+ξ. Số hạng đầu tiên bên tay phải xuất hiện do sự hoán đổi vị trí của các phân tử cạnh nhau. Tiếng ồn trắng không-thời gian ξ mô tả ngoại lực ngẫu nhiên tác động lên chúng. Hạng tử cuối cùng (∂h/∂x)2 đến từ thực tế rằng mặt phân cách không nhất thiết phải phát triển theo phương thẳng đứng, mà còn theo phương vuông góc với chính nó. Giá trị này nhận được bằng cách chiếu tốc độ phát triển của bề mặt lên phương thẳng đứng, kết hợp với định lí Pythagoras và một số phép xấp xỉ những giá trị nhỏ. 3 Lí thuyết cấu trúc chính quy. Lí thuyết phát triển bởi Martin Hairer được lấy cảm hứng từ một khái niệm gọi là đường thô25 do Terry Lyons đưa ra vào năm 1998 và mở rộng bởi Massimiliano Gubinelli. Nó có thể xem như một sự tổng quát hóa của chuỗi Taylor, cho phép xấp xỉ các hàm đủ trơn bởi các đa thức. Chẳng hạn, khai triển Taylor bậc hai của hàm f tại x được cho bởi f(y) = f(x) + c1(x)(y − x) + c2(x)(y − x)2 + r(x, y), ở đó phần dư r(x, y) tiến đến 0 khi y tiến dần về x. Các hệ số c1(x), c2(x) phụ thuộc vào f, chẳng hạn c1(x) là đạo hàm của f tại điểm x. Kiểu khai triển này thường được sử dụng để xác định nghiệm của một phương trình vi phân gần một điểm cụ thể cho trước. Lí thuyết của Martin Hairer cho phép có nhiều đối tượng trừu tượng phức tạp hơn đa thức trong khai triển Taylor của nghiệm. Các đối tượng này bao gồm chẳng hạn nghiệm Y0 của phương trình truyền nhiệt cưỡng bức bởi tiếng ồn trắng không-thời gian. Thay vì xem xét phương trình gốc, chúng ta nghiên cứu các phương trình thỏa mãn tất cả các hệ số trong khai triển Taylor. 25rough paths 59 Tạp chí Epsilon, Số 10, 08/2016 Phương pháp xấp xỉ liên tiếp Picard cho phép chứng minh sự tồn tại nghiệm trong không gian của các hệ số này. Cuối cùng, một định lí xây dựng lại liên kết một phân phối với nghiệm này. Định lí này sử dụng lí thuyết sóng nhỏ wavelet, một lí thuyết cũng được áp dụng nhiều trong kĩ thuật rửa ảnh, bao gồm cả ảnh kĩ thuật số. 4 Một phiên bản trước của bài viết này tựa đề Qu’est-ce qu’une Équation aux Dérivées Par tielles Stochastique?26 (có một số điểm khác, đặc biệt có nhiều video minh họa), đã được đăng trên Images des Mathématiques (một tạp chí toán học online của Trung tâm Nghiên cứu Khoa học Quốc gia Pháp - CNRS, trình bày các nghiên cứu toán học ra đại chúng bằng từ ngữ và hình ảnh, với mục tiêu tất cả bài viết được viết bởi các nhà toán học nhưng không có bài viết nào được viết dành cho các nhà toán học!), có thể đọc online tại địa chỉ http://images.math.cnrs.fr. Tài liệu [1] M. Hairer, A theory of regularity structures, Inventiones Mathematicae, vol. 198, pp. 269- 504, 2014. [2] G. Da Prato and A. Debussche, Strong solution to the stochastic quantization equations, Ann. Probab., vol. 31, pp. 1900-1916, 2003. [3] L. Bertini and G. Giacomin, Stochastic Burgers and KPZ equations from particle systems, Comm. Math. Phys., vol. 183, pp. 571-607, 1997. [4] M. Kardar et al., Dynamic scaling of growing interfaces, Physical Review Letters, vol. 56, pp. 889-892, 1986. 26do tác giả bài viết gửi cho người dịch 60 Tạp chí Epsilon, Số 10, 08/2016 HỌC CÁCH HỌC: MỘT BÀI HỌC QUAN TRỌNG BẬC NHẤT ĐANG BỊ BỎ QUÊN Dương Trọng Tấn Nếu bạn gặp một bài toán khó, dù cố gắng nhiều mà giải mãi không xong, thì làm thế nào? Câu trả lời phổ biến nhất là cố gắng tìm ra chỗ sai trong lập luận rồi đi tiếp hoặc “làm lại từ đầu”. Cả hai phương án theo kinh nghiệm này không phù hợp với những lời khuyên của các chuyên gia về não bộ. Theo họ, não bộ của chúng ta hoạt động theo hai cơ chế khác nhau: tập trung (focused Hình 1: Khi giải một bài toán, não sẽ tập trung với số ít các tế bào thần kinh. mode) và thư giãn (diffused mode). Khi ta tập trung cao độ vào giải quyết một bài toán, não sẽ vào cuộc sử dụng cơ chế tập trung với số ít các tế bào thần kinh tại một vùng tập trung của não bộ được huy động. Khi ta rơi vào thế bí như tình huống đã dẫn, thì dù có cố gắng đến mấy, cũng chỉ có vùng não tập trung được hoạt động. Có nghĩa là chúng ta có xu hướng lặp đi lặp lại các cách giải quyết vấn đề, và khó lòng thoát ra khỏi bế tắc. Khi đó hành động rà soát lại lời giải hay đi lại từng bước từ đầu không có ích gì mấy. Như thiên tài Albert Einstein từng nhận xét đại ý “bạn không thể giải bài toán theo 1000 cách giống nhau rồi hy vọng có lời giải khác!”. Trong những lúc bí bách như thế này, cách tốt nhất là tạm rời xa bài toán đấy, đi chơi, thư giãn rồi hẵng quay lại với bài toán. Đây không phải là lời xúi bậy vô trách nhiệm. Việc bạn tạm rời bài toán đó để đi bộ, hóng gió, hoặc ngồi thiền ít phút sẽ giúp não bộ chuyển sang chế độ thư giãn, lúc này các vùng khác của não bộ được kích hoạt. Nếu quay trở lại giải toán, bạn sẽ có khả năng tìm ra một con đường khác, không bế tắc như lúc đầu. Trên đây chỉ là một trong hàng tá ví dụ cho thấy những nghiên cứu về não bộ có thể giúp cải thiện đáng kể cách thức chúng ta học tập và làm việc. Tuy nhiên, bấy lâu nay chúng ta vẫn không mấy khi nghĩ về việc tìm hiểu các kiến thức loại này để cải thiện cách học tập, vì chúng ta thường phó mặc cho thói quen sai khiến trong các hoạt động của mình. Có thể dẫn ra đây một thói quen tai hại khác vẫn chiếm chỗ trong trường học của chúng ta: Các bài giảng dài. Bạn có thể gặp ở bất kì trường học nào các tiết học kéo dài từ 45 phút tới vài tiếng. Bạn cũng dễ dàng bắt gặp cảnh tượng hàng tá học sinh lơ đãng, ngủ gật, hoặc ngồi làm việc riêng trong lớp vì không thể chú tâm vào bài giảng. Trong khi hầu hết các giáo viên đổ lỗi cho các cô cậu học trò, thì các chuyên gia não bộ có một lời giải thích đơn giản cho hiện tượng này: 61 Tạp chí Epsilon, Số 10, 08/2016 Não chúng ta chỉ có khả năng chú tâm suy nghĩ trong một thời gian rất ngắn, chừng 10 phút1, sau đó là sẽ đến giai đoạn mất tập trung. Đây là cơ chế phòng vệ hết sức tự nhiên của não người, vì vậy hãy phân chia các bài giảng thành từng phân đoạn ngắn hơn. Sau mỗi 10 phút tập trung, hãy thiết kế một hoạt động để thư giãn và chuyển đổi sang phân đoạn tiếp theo. Thực ra đã từ lâu người ta đã biết dùng kĩ thuật phân giờ Pomodoro với các quy tắc đơn giản kể trên để gia tăng đáng kể năng suất làm việc và học tập. Một nghiên cứu đăng trên Psychological Science in the Public Interest năm 20132cho thấy, những phương pháp học tập được sử dụng phổ biến trong nhà trường như “tóm tắt nội dung bài giảng”, “dùng bút đánh dấu đoạn văn bản quan trọng khi đọc sách”, “đọc đi đọc lại một chương sách” hoá ra lại là những cách không mang lại mấy hiệu quả về ghi nhớ. Có những cách khác hữu hiệu hơn nhiều để giúp gia tăng hiệu quả học tập như: tích cực làm các bài luyện tập, hay học tập các kiến thức theo hình thức luyện tập phân tán với các khối kiến thức được chia nhỏ và học tập qua thời gian đủ dài. Nhìn từ những tình huống kể trên, trường học hiện nay có vẻ đang phí phạm rất nhiều thời gian của học trò chỉ vì ưa thích kinh nghiệm mà ít quan tâm tới việc tìm hiểu và vận dụng các kiến thức khoa học về việc con người học tập như thế nào để từ đó xây dựng các hoạt động giáo dục cho tối ưu. Chúng ta có thể liên hệ việc học tập như câu chuyện cái cần câu và con cá. Cách dạy truyền thống phổ biến hiện nay là dạng cho đi con cá, trong khi nếu ta trang bị năng lực tự học cho học sinh thì tức là cho họ một cái cần câu để tự lập suốt đời. Sự thiếu vắng những bài học liên quan đến việc rèn luyện kĩ năng học tập sẽ mang lại hậu quả mà chúng ta đã được chứng kiến là những thế hệ học trò thụ động chỉ biết trông chờ kiến thức và chân lý từ giáo viên và những người đi trước mà không để chủ động tự mình xây dựng tri thức cho mình. Điều này càng trở nên tai hại trong bối cảnh thời đại tri thức và số hóa hiện nay khi mà lượng thông tin mỗi năm tăng trưởng theo cấp số mũ. Kiến thức ngày hôm nay còn đúng, ngày mai có thể đã sai đi nhiều. Chỉ có cách làm chủ việc học như thế nào mới giúp học sinh đứng vững trong thế giới ngày nay. Thế cho nên, nhiều nhà giáo hiện nay đã thừa nhận rằng tiêu chuẩn xóa mù hiện nay không chỉ là biết đọc biết viết mà còn phải thạo cách tự học. Nhìn theo hướng này, chúng ta có thể dễ dàng đồng tình với nhận định của cha đẻ phương pháp Bản đồ Tư duy Tony Buzan: “Kĩ năng tự học là kĩ năng quan trọng nhất mà một người có thể sở hữu”. Thật may mắn là chúng ta có thể tìm thấy những sáng kiến mới trong một số chương trình giáo dục có để ý tới việc rèn luyện năng lực tự học trong chương trình giáo dục. Như sáng kiến Khung Kỹ năng thế kỷ XXI (p21.org) đã xếp kĩ năng học tập và sáng tạo thành một trong bốn hạng mục chính trong các năng lực cốt lõi mà học sinh thế kỉ XXI này phải thành thục. Hay như nhóm Cánh Buồm chủ trương xây dựng chương trình giáo dục tiểu học hiện đại xoay quanh tư tưởng chủ đạo với một từ duy nhất: tự học. Theo đó học sinh được rèn luyện phương pháp học tập từ tiểu học. Kết thúc bậc tiểu học, trẻ em có được năng lực tự học vững vàng để sang bậc học cao hơn các em sẽ sử dụng năng lực ấy để tự mình đến với tri thức thay vì phụ 1Medina, J. (2011). Brain Rules: 12 Principles for Surviving and Thriving at Work, Home, and School (Large Print 16pt). ReadHowYouWant.com 2Dunlosky, J., Rawson, K. A., Marsh, E. J., Nathan, M. J., & Willingham, D. T. (2013). Improving stu dents’ learning with effective learning techniques promising directions from cognitive and educational psychol ogy.Psychological Science in the Public Interest, 14(1), 4-58 62 Tạp chí Epsilon, Số 10, 08/2016 thuộc vào sự truyền tải thông tin một chiều từ nhà trường. Nhóm Cánh Buồm xác quyết: “Giáo dục tức là tự giáo dục, tự làm ra chính mình!”. Nhóm đã đi xa hơn việc tuyên ngôn vài bước với sự quy trình hóa kĩ thuật để trẻ em thực sự xây dựng được phương pháp học cho mình. Người xưa có câu, phàm phải trong tình huống khó lường thì “lấy bất biến ứng vạn biến”. Đối với việc học tập, cái bất biến là phương pháp tự học, cái vận động không ngừng là tri thức của thời đại. Không gì bằng trang bị cho được cái bất biến đó để người học của thế kỉ 21 có thể tự mình đi trên đôi chân tự do khám phá cánh đồng tri thức của nhân loại trong suốt cuộc đời. Thiếu kĩ năng thiết yếu này thì những khẩu hiệu rổn rảng về xã hội học tập, hay học tập suốt đời chỉ cùng lắm là những lời nói cho sang miệng. Bài học về cách học cần phải là bài học căn cơ nhất mà mỗi học sinh cần phải được luyện rèn. 63 Tạp chí Epsilon, Số 10, 08/2016 LEONHARD EULER - NGƯỜI THẦY VĨ ĐẠI Nguyễn Đức Hưng GIỚI THIỆU Euler là một nhà toán học, vật lý học, thiên văn học vĩ đại. Ông là người đã đặt nền móng cho không biết bao nhiêu lý thuyết sâu sắc giúp giải quyết cho rất rất nhiều các bài toán thực tế và quả thật ông là một người thầy vĩ đại của tất cả chúng ta. Bài viết này giới thiệu giản lược về cuộc sống của ông và tóm tắt các công trình của ông. Kỳ 1 : Cuộc sống thăng trầm của Euler Thời niên thiếu Leonhard Euler sinh ngày 15=04=1707 và là con trai cả của Paulus Euler và Margaretha Brucker. Khi mới sinh Euler, cha của ông là Paulus khi ấy còn đang là một cha xứ tại nhà thờ thánh Jakob ngoại ô Basel. Mặc dù là một cha xứ nhưng ông lại rất yêu thích Toán học, vì vậy trong hai năm đầu đại học, ông đã đăng ký để được học các môn Toán với nhà Toán học nổi tiếng Jakov Bernuly. Sau đó, gia đình Euler chuyển tới Riehen, một vùng ngoại ô của thành phố Basel, tại đây cha của Euler đã trở thành mục sư Tin Lành của giáo xứ địa phương cho tới cuối đời. Năm 8 tuổi Euler được gửi tới trường Latin để học tập, nhưng trước đó Euler đã được học Toán và các kiến thức khác từ cha của mình. Trong thời gian học ở trường Latin, Euler sống cùng với bà ngoại và học thêm với gia sư Johannes Burckhardt, một nhà Thần học trẻ tuổi và đặc biệt say mê Toán học. Tháng 10=1720; ở tuổi mười ba 1 Leonhard theo học tại Đại học Basel với chuyên ngành Triết học, đồng thời đăng ký học phần toán sơ cấp và được chính Johann Bernoulli 2 giảng dạy. Bằng sự đam mê và nhiệt huyết của mình trong việc học tập mà chàng trai trẻ Leonhard nhanh chóng được Bernoulli để ý và khuyến khích Leonhard học tập và nghiên cứu Toán học. Năm 1723; Euler tốt nghiệp thạc sĩ và có một bài giảng đại chúng 3 với chủ đề “so sánh triết học Descart và triết học Newton”. Năm 19 tuổi, Euler đã giành được một giải thưởng từ Viện Hàn lâm Khoa học Paris với lý thuyết về vị trí tối ưu của cánh buồm trên các con tàu. Điều đặc biệt là trong suốt quãng thời gian trước đó, Euler hầu như không thấy một con tàu nào. Một năm sau, khi chiếc ghế giáo sư vật lý tại Đại 113 tuổi Leonhard vào đại học không phải là điều bất thường vào thời điểm đó. 2Là một nhà Toán học nổi tiếng với khái niệm vô hạn. Ông cũng là em trai của Jakob Bernoulli thầy của cha Leonhard. 3Bài giảng bằng tiếng Latin. 64 Tạp chí Epsilon, Số 10, 08/2016 Hình 1: Chân dung Euler, hiện được treo ở Bảo tàng Mỹ thuật Basel. học Basel bị khuyết, Euler đã được Johann Bernoulli hỗ trợ rất nhiều để có thể ngồi vào vị trí này, nhưng thất bại, cũng dễ hiểu bởi khi đó Euler còn quá trẻ và thiếu các nghiên cứu được công bố rộng rãi. Sau thất bại này, Euler nhận lời mời từ Viện Hàn lâm Khoa học ở St.Petersburg, mới được thành lập vài năm trước đó bởi Nga Hoàng Peter I (căn nguyên của lời mời này xuất phát từ Johann Bernoulli và hai con trai của ông bởi tất cả đã từng làm việc tại đây). Bước chuyển lớn Đầu năm 1727; Euler chuyển tới St.Petersburg. Tại đây ngoài việc nghiên cứu Toán, Euler còn tham vấn cho Nga về các câu hỏi khoa học và công nghệ trong bài kiểm tra trong các kỳ thi dành cho thiếu sinh quân Nga. Khác biệt với các nghiên cứu viên nước ngoài tại viện, Euler nhanh chóng thích nghi với điều kiện sống khắc nghiệt ở Bắc Âu và đồng thời Euler cũng nhanh chóng học và sử dụng thành thạo tiếng Nga để phục vụ cho đời sống và các nghiên cứu của mình. Trong thời gian này, Euler sống cùng với Daniel Bernoulli và trở thành bạn thân của Christian Goldbach 4, thư ký của Viện. Những trao đổi giữa Euler và Goldbach đã trở thành những cứ liệu quan trọng cho lịch sử khoa học thế kỷ XVIII. Khoảng thời gian ở Viện là khoảng thời gian Euler làm việc hiệu quả và sáng tạo nhất, ông đã cho ra nhiều kết quả đặc biệt và chúng đã mang lại cho ông vị trí và sự nổi tiếng tại Viện và trên toàn thế giới sau này. Tháng 1=1734; Euler kết hôn với Katharina Gsell, con gái của một họa sĩ Thụy Sĩ cũng đang giảng dạy trong Viện. Cuộc sống gia đình của Euler không hề suôn sẻ như công việc của ông tại Viện, họ có tới 13 người con nhưng chỉ có 5 trong số đó là phát triển khỏe mạnh, trong đó có 4Christian Goldbach nhà Toán học người Đức, ông nổi tiếng với giả thuyết Goldbach mà cho tới ngày nay vẫn còn đang là một bài toán chưa có lời đáp. 65 Tạp chí Epsilon, Số 10, 08/2016 một người trở thành một nhà Toán học và là trợ lý của ông sau này. Năm 1735 ông bệnh nặng, và tưởng như không qua khỏi. Một phép màu đã giúp ông vượt qua nó, nhưng suốt ba năm sau đó bệnh tật tiếp tục hành hạ Euler và lần này nó khiến ông mất con mắt bên phải (có thể nhận thấy rất rõ điều này qua những bức chân dung của Euler từ khoảng thời gian này). Cùng với thời điểm cuộc khủng hoảng chính trị ở Nga năm 1740; gây ra cái chết của nữ hoàng Nga Anna Ivanovna, Euler nhận được lời mời từ Quốc vương Phổ Frederick II đến Berlin để giúp thành lập Viện Hàn lâm Khoa học tại đây và ông đã quyết định rời St. Petersburg. Thêm nữa, ông cũng đã viết trong hồi ký của mình như sau: “... năm 1740; khi Nhà vua Phổ bắt đầu lên nắm quyền hành, tôi nhận được một lời mời từ Berlin, và tôi nhận lời không chút ngần ngại, sau khi nữ hoàng Anne bị sát hại và kéo theo đó là sự trì trệ của vương triều ...” Tháng 6=1741; Euler cùng với vợ và hai người con của mình khi ấy là Johann Albrecht sáu tuổi và Karl mới một tuổi rời St. Petersburg để tới Berlin. Thời ở Berlin 1741 - 1766 Một khởi đầu có vẻ không thuận lợi như Euler nghĩ, vì còn dang dở cuộc chiến ở Silesia, Frederick II chưa thể tập trung cho việc xây dựng viện, vì thế mãi tới tận 1746 viện mới chính thức ra đời. Viện trưởng là nhà toán học Pháp, còn Euler phụ trách ngành Toán. Trong suốt thời gian dài chờ đơi, Euler đã hoàn thành cuốn hồi ký viết tới 200 lá thư cùng năm bài luận lớn. Tuy phải đảm trách rất nhiều công việc tại Viện từ quản lý đài thiên văn, vườn bách thảo, làm việc trực tiếp với nhân viên, nghiên cứu viên, thậm chí đảm trách cả việc bán những cuốn niên giám để đảm bảo nguồn thu cho Viện, nhưng không vì vậy mà năng suất làm Toán của Euler bị suy giảm. Trong thời gian này Euler tham gia cuộc tranh luận về nguồn gốc của “nguyên lý tác động tối thiểu (principle of least action)”5. Năm 1740; nguyên lý này được phát biểu bởi Pierre - Louis Moreau de Maupertuis, nhưng Johann Samuel căn cứ vào bức thư của Leibniz gửi Jakob đã cho rằng người phát biểu nguyên lý này đầu tiên là Leibniz. Euler được lôi vào cuộc tranh luận nhằm làm sáng tỏ vấn đề, nhưng do không mấy đồng tình với triết học của Leibniz, Euler đã đứng về phía Maupertuis và cáo buộc Johann làm giả tài liệu. Cuộc tranh cãi này càng trở nên sôi nổi khi Voltaire tham gia cuộc tranh luận và ông đứng về phía Johann, Voltaire đã chỉ trích rất gay gắt cả Euler và Maupertuis. Trước áp lực dư luận Maupertuis đã rời khỏi Berlin và Euler chịu trách nhiệm mọi công việc ở Viện. Quan hệ của Euler với Fredric II không được “suôn sẻ”, do sự khác biệt rõ rệt về tính cách cũng như tư tưởng. Fredric tự tin, hài hước và quảng giao còn Euler khiêm tốn, sống kín đáo và là một tín đồ theo đạo Tin Lành. Mặt khác sau khi Maupertuis rời Berlin, Euler là người đã chèo chống con thuyền Viện Hàn lâm nhưng Ferderic khi đó đã phớt lờ mọi lời giới thiệu Euler vào vị trí viện trưởng và bỏ qua tất cả để rồi sau đó tuyên bố chính mình mới là Viện trưởng Viện Hàn lâm. Tất cả các điều trên cùng với việc không được sự ủng hộ của các quý tộc khác dẫn tới Euler chấp nhận một lời mời của nữ hoàng Catherine II để trở về St.Petersburg. 5Nguyên lý tác động tối thiểu là một nguyên lý biến phân được áp dụng rộng rãi trong vật lý. Áp dụng nguyên lý này có thể dễ dàng tìm ra được phương trình quỹ đạo của các chuyển động. 66 Tạp chí Epsilon, Số 10, 08/2016 St.Petersburg 1766 – 1783 Thời kỳ này cuộc sống của Euler có nhiều trắc trở về mặt cá nhân, mắt phải của ông bị đục thủy tinh thể (mắt còn tốt) và làm giảm thị lực rất nhiều. Năm 1771; sau ca phẫu thuật, thị lực của mắt phải của ông suy giảm nhanh chóng, và gần như mù hẳn. Cũng trong năm này, nhà của Euler bị cháy trong trong vụ đại hoả hoạn ở St.Peterburg vào tháng năm thiêu rụi hơn 5000 ngôi nhà, Euler được cứu bởi người hầu của mình là Peter Grimm. Hình 2: Euler được Peter cứu thoát từ ngôi nhà của mình trong trận đại hoả. Bù đắp lại một phần khó khăn của Euler, nữ hoàng Catherine đã cho xây dựng lại một căn nhà khác cho Euler. Thêm một nỗi đau năm 1773; vợ ông, Katharina Gsell chết. Euler tái hôn ba năm sau đó để không phải phụ thuộc vào con cái của mình. Trong hoàn cảnh gặp nhiều khó khăn như vậy nhưng Euler không hề nản chí, ông vẫn làm việc và say sưa nghiên cứu với sự giúp đỡ từ những người khác, đầu tiên là từ nữ hoàng Catherine, sau đó là Niklaus Fuss, một người đồng hương tới từ Thuỵ Sỹ, cháu rể tương lai của Euler và người con trai của mình. Gần một nửa các công trình khoa học, các bài báo của Euler được viết trong quãng thời gian ở St.Petersburg lần thứ hai này. Leonhard Euler chết vì đột quỵ ngày 18=9=1783 trong khi chơi với một trong những đứa cháu của mình. Cũng chính vào ngày này, trên hai phiến đá lớn, ông đã viết ra công thức diễn giải bản chất Toán học có liên quan tới việc chuyển động của khinh khí cầu mà chuyến bay đầu tiên do hai em nhà Montgolfier thực hiện vào ngày 5=6=1783: Đó là bài viết cuối cùng của ông, và chuẩn bị xuất bản bởi con trai của ông là Johann Albrecht. Nhưng việc xuất bản các công trình cũng như bài viết của Euler vẫn còn kéo dài suốt 50 năm kể từ sau ngày ông mất. 67 Tạp chí Epsilon, Số 10, 08/2016 GIÁ TRỊ NÀO CHO 1 + 1 + 1 + · · · ? +∞ HAY −12? Lý Ngọc Tuệ Mathworks, Inc. LỜI GIỚI THIỆU CỦA BAN BIÊN TẬP Tổng của dãy vô hạn 1 + 1 + 1 + · · · = ∞ hay −12? Hẳn phần lớn bạn đọc sẽ nhanh chóng trả lời là ∞, nhưng liệu −12cũng là một câu trả lời đúng? Xa hơn nữa, tổng vô hạn 1 − 1 + 1 − 1 + · · · là ∞, là 0 hay −112? Hẳn nhiều bạn đọc sẽ còn ngạc nhiên hơn nữa khi chúng tôi nói rằng con số −112không chỉ không vô lý mà kết quả này lại liên quan đến lý thuyết dây trong Vật lý! Để làm rõ vấn đề thú vị này, chuyên mục Toán học Giải trí trân trọng giới thiệu đến bạn đọc loạt bài viết về các chuỗi vô hạn từ tác giả Lý Ngọc Tuệ. 1. Giới thiệu Sau khi biết được các tính chất của các phép tính cơ bản như: cộng, trừ, nhân, chia với 2 số thực và thứ tự thực hiện, chúng ta có thể mở rộng ra để tính được giá trị của một biểu thức bao gồm hữu hạn các phép toán trên. Bước phát triển tự nhiên tiếp theo sẽ là tìm cách gán giá trị cho một biểu thức với vô số (đếm được) các phép tính cơ bản, mà trong đấy, dạng biểu thức đơn giản nhất chỉ bao gồm phép cộng hoặc trừ, được gọi là chuỗi1: a0 + a1 + a2 + · · · =X∞ n=0 với a0, a1, a2, ... ∈ R là các số thực. an (1.1) Việc gán giá trị cho những chuỗi số đã được thực hiện bởi các nhà khoa học từ cách đây hơn 2000 năm. Cách tính giá trị của những chuỗi cấp số nhân chẳng hạn như: 1 n X∞ = 1 +12+14+18+ · · · = 2 2 n=0 1series 68 Tạp chí Epsilon, Số 10, 08/2016 đã được biết đến trong các ghi chép từ thời Hy Lạp cổ đại. Tuy nhiên, mãi đến tận thế kỷ 17 và 18 với sự ra đời của giải tích, đạo hàm và tích phân, việc tính toán với các chuỗi vô hạn mới trở nên phổ biến. Nhiều phương pháp biến đổi và gán giá trị cho chuỗi được đưa ra, tuy nhiên các kết quả đạt được lại thường không nhất quán. Mặc dù các nhà toán học lớn thời đấy như Newton, Leibnitz, hay Euler dường như biết được những chuỗi nào là an toàn trong tính toán, họ (đặc biệt là Euler) vẫn sử dụng các chuỗi ‘không an toàn’ để thu được nhiều kết quả quan trọng. Những kết quả này sau đấy đã được xác nhận lại bằng các phương pháp khác một cách độc lập. Mãi đến tận thế kỷ 19, định nghĩa chính xác và tổng quát về chuỗi hội tụ mới được đưa ra bởi Cauchy [1]. Định nghĩa của Cauchy, cùng với mở rộng giải tích2cho đến hiện nay có thể nói là phương pháp chính thống được sử dụng rộng rãi nhất trong tính toán chuỗi và hàm số. Tuy nhiên không phải các chuỗi không hội tụ theo Cauchy (gọi là chuỗi phân kỳ) đều vô dụng. Có nhiều phương pháp tính toán có thể được áp dụng cho các chuỗi phân kỳ, gọi chung là các phương pháp tính tổng3. Lý thuyết tổng quát về các phương pháp tính tổng được xây dựng và hoàn thiện vào cuối thế kỷ 19, đầu thế kỷ 20, và hiện nay những phương pháp này được ứng dụng phổ biến trong lý thuyết số và vật lý. Trong phần đầu của loạt bài về chuỗi vô hạn này, chúng ta sẽ giới thiệu về 2 phương pháp lấy tổng của Cauchy và Abel, và một số tính chất mong muốn cho phương pháp lấy tổng. 2. Chuỗi hình thức và Chuỗi lũy thừa hình thức Với mỗi dãy số vô hạn (a0, a1, a2, ...), ngoài chuỗi (1.1), chúng ta còn quan tâm đến dạng chuỗi lũy thừa với hệ số (a0, a1, a2, ...) với tâm ở c như sau: X∞ an(x − c)n = a0 + a1(x − c) + a2(x − c)2 + ... (2.1) n=0 Khi chưa được gán giá trị, các chuỗi X∞ n=0 an và X∞ n=0 an(x − c)nđược tạo bởi dãy (a0, a1, ...) còn được gọi là các chuỗi hình thức4và chuỗi lũy thừa hình thức5. Thông qua phép gán các chuỗi / chuỗi lũy thừa với dãy các hệ số: X∞ n=0 an ←→ (a0, a1, ...), an(x − c)n ←→ (a0, a1, ...), 2analytic continuation 3summation methods 4formal series 5formal power series 69 X∞ n=0 Tạp chí Epsilon, Số 10, 08/2016 chúng ta có được mối tương quan 1-1 giữa không gian các chuỗi hình thức và không gian các dãy vô hạn đếm được6. Thông qua mối tương quan này, không gian các chuỗi hình thức / chuỗi lũy thừa hình thức có thể được thường hưởng cấu trúc của một không gian véc tơ với số chiều là vô hạn đếm được, mà trong đấy, các phép cộng và nhân với một số thực được thực hiên theo từng thành phần: X∞ n=0 an +X∞ n=0 cX∞ n=0 bn =X∞ n=0 an =X∞ n=0 (an + bn), can. Ngoài cấu trúc không gian véc tơ ra, không gian các dãy còn có phép nhân từng phần tử: (a0, a1, a2, ...) · (b0, b1, b2, ...) = (a0b0, a1b1, a2b2, ...), tuy nhiên nếu chúng ta đưa phép nhân này sang không gian các chuỗi, kết quả thu được sẽ không giống như mở rộng của tích của 2 tổng hữu hạn. Cách mở rộng tự nhiên của phép nhân với 2 tổng hữu hạn ra chuỗi vô hạn được định nghĩa như sau: X∞ n=0 an ! · X∞ n=0 ! bn := X∞ n=0 Xn i=0 aibn−i ! . Tương tự như vậy, các chuỗi lũy thừa hình thức có một phép nhân tự nhiên được thường hưởng / mở rộng từ phép nhân đa thức: X∞ n=0 an(x − c)n ! · X∞ n=0 ! bn(x − c)n =X∞ n=0 Xn i=0 aibn−i ! (x − c)n. Với phép nhân này, tập các chuỗi lũy thừa hình thức trở thành một vành giao hoán, thường được ký hiệu bởi R[[x − c]]. Vành các chuỗi lũy thừa hình thức có thể được ký hiệu bởi R[[1]]. Bài tập 1. Tìm phần tử đơn vị 1R[[x]] sao cho với mọi X∞ n=0 anxn, 1R[[x]] · X∞ n=0 ! anxn =X∞ n=0 anxn. Nhắc lại phần tử a của một vành giao hoán R được gọi là khả nghịch7nếu như tồn tại b ∈ R sao cho a · b = 1R. Bài tập 2. Chứng minh rằng một chuỗi hình thức X∞ an là một phần tử khả nghịch khi và chỉ khi an 6= 0 với mọi n ∈ N. n=0 6có thể được xem như là không gian các hàm số RN:= {f : N → R} 7invertible 70 Tạp chí Epsilon, Số 10, 08/2016 Bài tập 3. Chứng minh rằng một chuỗi lũy thừa hình thức X∞ an(x − c)nlà một phần tử đơn vị (khả nghịch) khi và chỉ khi a0 6= 0. Bài tập 4. Tìm dãy (an) sao cho: X∞ xn n=0 ! · X∞ n=0 ! anxn n=0 = 1R[[x]]. 3. Chuỗi hội tụ theo Cauchy Với mỗi chuỗi hình thức X∞ n=0 an, chúng ta có thể xây dựng dãy các tổng từng phần (sn) như sau: s0 = a0, s1 = a0 + a1, s2 = a0 + a1 + a2, ... sn = a0 + a1 + a2 + · · · + an ... Định nghĩa 5. Nếu như dãy sn hội tụ về một số thực s, ký hiệu là sn → s hoặc limn→∞sn = limnsn = lim sn = s, chúng ta sẽ gọi chuỗiX∞ an là một chuỗi hội tụ, và gán giá trị s cho chuỗi X∞ n=0 an. Nếu X∞ n=0 n=0 an được gọi là một chuỗi phân kỳ nếu như nó không hội tụ. Đây là cách gán giá trị cho chuỗi phổ biến nhất, thường được ký hiệu bởiX∞ n=0 an = s. Tuy nhiên, trong loạt bài này, để tiện cho việc phân biệt giữa chuỗi hình thức và các cách tính tổng khác nhau, chúng ta sẽ ký hiệu cách gán giá trị cho chuỗi hình thức này là: ai = s, (C) theo tên của Cauchy. X∞ n=0 ! an = limn→∞sn = limn→∞Xn i=0 Bài tập 6. Chứng minh rằng nếu như X∞ an và X∞ bn là 2 chuỗi hội tụ, c, d là 2 số thực bất kỳ, thì: cX∞ an + dX∞ n=0 ! n=0 X∞ ! X∞ ! (C) n=0 bn n=0 = c · (C) 71 an n=0 + d · (C) n=0 bn . Tạp chí Epsilon, Số 10, 08/2016 Bài tập trên cho ta thấy: 1. Tập các chuỗi hội tụ là một không gian véc tơ con. 2. Cách gán giá trị (C) là một hàm tuyến tính từ không gian các chuỗi hội tụ vào R. Bài tập 7. Tìm 2 chuỗi hội tụ X∞ an và X∞ bn sao cho chuỗi X∞ an ! · X∞ bn ! không hội tụ. n=0 n=0 n=0 n=0 Như vậy tập các chuỗi hình thức hội tụ không phải là một tập đóng đối với phép nhân, hay nói một cách khác, cách gán giá trị (C) không tương thích với phép nhân các chuỗi hình thức. Tuy vậy, nếu như an, bn đều là các số không âm, và các chuỗi X∞ n=0 an và X∞ n=0 bn hội tụ thì tích của chúng cũng là một chuỗi hội tụ. Tính chất được chứng minh bởi Cauchy với định nghĩa và kết quả sau: Định nghĩa 8. Chuỗi X∞ n=0 an được gọi là hội tụ tuyệt đối8nếu như chuỗi X∞ n=0 |an| hội tụ. Định lý 9. (1) X∞ n=0 an hội tụ tuyệt đối =⇒X∞ n=0 an hội tụ. (2) X∞ n=0 an và X∞ n=0 bn hội tụ tuyệt đối =⇒ X∞ n=0 an ! · X∞ n=0 bn ! hội tụ tuyệt đối. Hay nói một cách khác, tập các chuỗi hội tụ tuyệt đối tạo thành một vành con đồng thời cũng là một không gian tuyến tính con (hay còn gọi là một R-đại số con) của tập các chuỗi hình thức. 4. Chuỗi lũy thừa hội tụ và phương pháp của Abel Định nghĩa 10. Một chuỗi lũy thừa hình thức X∞ an(x − c)nđược gọi là hội tụ tại z ∈ R nếu như chuỗi X∞ n=0 n=0 an(z − c) hội tụ. Có thể dễ dàng thấy được rằng các chuỗi lũy thừa có tâm tại c đều hội tụ tại c. Hơn nữa, định lý sau chỉ ra rằng các chuỗi lũy thừa chỉ hội tụ trong một đoạn thẳng có tâm ở c (bán kính có thể là +∞): 8absolutely convergent 72 Tạp chí Epsilon, Số 10, 08/2016 Định lý 11. Với mỗi chuỗi lũy thừa Xn n=0 an(x − c)n, đặt (cho phép bằng +∞): R =1 lim sup|an|1/n . (1) Với mọi |z − a| < R, chuỗi lũy thừa X∞ n=0 (2) Với mọi |z − a| < R, chuỗi lũy thừa X∞ n=0 an(x − c)nhội tụ tuyệt đối tại z, an(x − c)nphân kỳ tại z. Số R được định nghĩa như trên được gọi là bán kính hội tụ của chuỗi X∞ an(x − c)n. Bài tập 12. Chứng minh rằng nếu dãy a0 a1 , a1 a2 , a2 a3 n=0 , ... hội tụ, thì R = limn→∞ an an+1 . Bài tập 13. Chứng minh rằng nếu như cả 2 chuỗi Xn an(x − c)nvà Xn bn(x − c)nđều có bán kính hội tụ ≥ r > 0, thì cả 2 chuỗi lũy thừa: Xn n=0 an(x − c)n ! + Xn n=0 an(x − c)n ! và Xn n=0 an(x − c)n ! · Xn n=0 ! an(x − c)n n=0 đều có bán kính hội tụ ≥ r. n=0 Quan sát kỹ một tí, chúng ta có thể thấy rằng khi x − c = 1, chuỗi lũy thừa X∞ an(x − c)nsẽ trở thành chuỗi X∞ n=0 n=0 an. Để cho đơn giản, chúng ta xét chuỗi lũy thừa có tâm ở 0 X∞ n=0 anxn. Nếu như chuỗi lũy thừa này có bán kính hội tụ R ≥ 1, và tồn tại giới hạn: lim x→1− X∞ n=0 anxn, thì chúng ta gọi chuỗi X∞ n=0 an là Abel-khả tổng9(hoặc (A)-khả tổng), và gán giá trị của giới hạn này cho chuỗi: 9Abel summable (A)X∞ n=0 an := lim x→1− 73 X∞ n=0 anxn. Bài tập 14. Chứng minh rằng nếu như X∞ n=0 thực bất kỳ, thì: an và X∞ n=0 Tạp chí Epsilon, Số 10, 08/2016 bn là 2 chuỗi Abel-khả tổng, c, d là 2 số (A) cX∞ n=0 an + dX∞ n=0 bn ! = c · (A) X∞ n=0 an ! + d · (A) X∞ n=0 bn ! . 5. Chuỗi phân kỳ - Một số tính chất mong muốn Trở lại với ví dụ ở đầu bài, xét chuỗi X∞ 1 = 1 + 1 + 1 + ..., dãy các tổng từng phần có thể dễ dàng tính ra được: n=0 (s0, s1, s2, ..., sn, ...) = (1, 2, 3, ...,(n + 1), ...), và như vậy chuỗi 1 + 1 + 1 + ... là phân kỳ theo cách gán giá trị của Cauchy: limn→∞sn = limn→∞(n + 1) = ∞. Bài tập 15. Chứng minh rằng chuỗi 1 + 1 + 1 + ... không phải là một chuỗi Abel khả tổng. Vậy liệu có tồn tại mộ cách gán giá trị cho chuỗi (T ) nào đó sao cho (T )(1 + 1 + 1 + ...) là hữu hạn? Điều này tùy thuộc vào việc chúng ta muốn (T ) sở hữu thêm những tính chất nào khác nữa. Chúng ta tạm thời liệt kê một số tính chất mà (T ) nên có như sau: (1) T là hàm tuyến tính. (2) Nếu như chuỗi X n=0 an hội tụ thì X n=0 an (T )-khả tổng. (2*) (T ) đồng ý với (C): nếu như chuỗi X n=0 an hội tụ thì (T ) X n=0 an ! = (C) X n=0 an ! . (3) Nếu như chuỗi X n=0 X an là (T )-khả tổng thì: ! (T ) n=0 an = (T )(a0 + a1 + a2 + ...) = a0 + (T )(a1 + a2 + a3 + ...). 74 Tạp chí Epsilon, Số 10, 08/2016 Tính chất (3) tương đương với việc phương pháp tính tổng vô hạn (T ) không vụ thuộc vào một số hữu hạn các số hạng đầu tiên, có thể xem như là một mở rộng của phép cộng hữu hạn số hạng. Tính chất này tuy có vẻ hợp lý, nhưng lại có thể dẫn đến một số kết luận có vẻ vô lý như sau: Nếu như (T ) gán một giá trị hữu hạn s cho tổng 1 + 1 + 1 + ..., đồng thời thỏa mãn các tính chất (3), thì: s = (T )(1 + 1 + 1 + ...) = 1 + (T )(1 + 1 + 1 + ...) = 1 + s. Từ đó ta suy ra: (T )(1 + 1 + 1 + ...) = s = +∞ (!!!). Như vậy để gán được giá trị hữu hạn cho chuỗi (1 + 1 + 1 + ...), chúng ta sẽ mất đi tính chất (3). Một trong những phương pháp phổ biến để gán giá trị hữu hạn cho chuỗi (1 + 1 + 1 + ...) là sử dụng mở rộng giải tích10 của chuỗi: X∞ n=1 n−s = 1−s + 2−s + 3−s + ... Về mặt hình thức,X∞ n=1 n−0 = 10 + 20 + 30 + ... = 1 + 1 + 1 + ... Tuy nhiên, chuỗi X∞ n=1 n−schỉ hội tụ tuyệt đối khi s > 1 và phân kỳ khi s = 1. Khó khăn này được giải quyết bằng cách mở rộng ra không gian số phức C thay cho số thực. Khi đấy, chuỗi X∞ n−slà đại diện của hàm giải tích ζ(s) trên tập {s ∈ C : <(s) > 1}. Hàm này có một mở n=1 rộng giải tích duy nhất ra C r {1}, và chúng ta có thể gán giá trị của hàm này tại 0 này cho chuỗi (1 + 1 + 1 + ...). Chúng ta sẽ ký hiệu phương pháp tính tổng này bởi (E): (E)(1 + 1 + 1 + ...) = ζ(0) = −12. Trong phần sau, chúng ta sẽ đi sâu hơn vào chi tiết của mở rộng giải tích, một trong những khái niệm và phương pháp rất quan trọng của toán học. Tài liệu [1] A. L. Cauchy, Analyse algébrique, Paris (1821). [2] J. B. Conway, Functions of One Complex Variable, Graduate Texts of Mathematics 11, Springer-Verlag (1973). [3] G. H. Hardy, Divergent series, Oxford (1949). 10analytic continuation 75 Tạp chí Epsilon, Số 10, 08/2016 TIẾP NỐI CÂU CHUYỆN VỀ MỘT TỔNG LŨY THỪA Trịnh Đào Chiến (Cao đẳng Sư phạm Gia Lai) Giả sử n và k là các số nguyên dương. Trong [2], tác giả Trần Nam Dũng đã đề cập những điều thú vị về tổng Sk (n) = Xn j=1 jk = 1k + 2k + · · · + nk. (1) Trong [3], Nguyễn Mạnh Linh tiếp tục đề cập một số tính chất của tổng (1), bằng cách tiếp cận các đa thức Sk (x) xác định bởi các hệ thức truy hồi. Tiếp nối mạch suy nghĩ trên, bài viết này đề cập đến một số trường hợp đặc biệt của tổng Sk (n) = Xn j=1 xjk = x1k + x2k + · · · + xnk, (2) một dạng tổng quát hóa trực tiếp của tổng (1). Trước hết, ta nhắc lại Đồng nhất thức Newton, một đồng nhất thức quan trọng, liên quan đến tổng (2). 1. Đồng nhất thức Newton Đồng nhất thức Newton, lần đầu tiên được nhà toán học Newton thiết lập vào Thế kỷ 17. Từ đó đến nay, đã có nhiều cách chứng minh cho đồng nhất thức này. Với n = 3, đồng nhất thức Newton được thiết lập như sau: Giả sử x1, x2, x3 ∈ R. Thế thì x1, x2, x3 là nghiệm của phương trình (x − x1) (x − x2) (x − x3) = 0, hay x3 − (x1 + x2 + x3) x2 + (x1x2 + x2x3 + x3x1) x − x1x2x3 = 0. 76 Tạp chí Epsilon, Số 10, 08/2016 Đặt  c1 = − (x1 + x2 + x3) c2 = x1x2 + x2x3 + x3x1 c3 = −x1x2x3 Thế thì x1, x2, x3 là nghiệm của phương trình x3 + c1x2 + c2x + c3 = 0. Đặt Sk = x1k + x2k + x3k, k = 1, 2, 3, 4, . . . Thế thì ta có đồng nhất thức sau  S1 + c1 = 0, S2 + S1c1 + 2c2 = 0, S3 + S2c1 + S1c2 + 3c3 = 0, S4 + S3c1 + S2c2 + S1c3 = 0,  S5 + S4c1 + S3c2 + S2c3 = 0, . . . Sk + Sk−1c1 + Sk−2c2 + Sk−3c3 = 0, k > 4. Đồng nhất thức trên được gọi là đồng nhất thức Newton, trong trường hợp n = 3. Từ khi được thiết lập, đã có nhiều cách chứng minh cho đồng nhất thức Newton. Với những giá trị đầu tiên của số nguyên dương n, đồng nhất thức Newton có thể được kiểm tra một cách dễ dàng. Tuy nhiên, trong trường hợp n tổng quát, các cách chứng minh đều phải dùng đến việc khai triển chuỗi Taylor đối với một số hàm số quen thuộc, trong khi khái niệm chuỗi và việc khai triển này chưa có ở phổ thông. Dưới đây là một trong những phương pháp thiết lập Đồng nhất thức Newton trong trường hợp n = 3 và trường hợp n bất kì. 1.1. Thiết lập đồng nhất thức Newton, trường hợp n = 3 Ta có (x − x1) (x − x2) (x − x3) = x3 + c1x2 + c2x + c3. (3) Trong (3), thay x bởi 1x, ta có =1x3+c1 x2+c2x+ c3, hay 1 x− x1 1 x− x2 1 x− x3 (1 − x1x) (1 − x2x) (1 − x3x) x3=1x3+c1 x2+c2x+ c3. Một cách tương đương, ta có (1 − x1x) (1 − x2x) (1 − x3x) = 1 + c1x + c2x2 + c3x3. (4) 77 Bây giờ, xét chuỗi lũy thừa “hình thức” X∞ k=1 Lưu ý rằng, bởi khai triển Taylor, ta có Tạp chí Epsilon, Số 10, 08/2016 Skxk. xk =1 1 − x. Suy ra rằng X∞ k=0 1 +X∞ k=1 xk =1 1 − x hayX∞ k=1 Do đó, bởi (4) và (5), ta có xk =x 1 − x. (5) X∞ k=1 Skxk =X∞ k=1 x1k + x2k + x3k xk =X∞ k=1 (x1x)k + (x2x)k + (x3x)k =X∞ k=1 (x1x)k +X∞ k=1 d (x2x)k +X∞ k=1 (x3x)k =x1x 1 − x1x+x2x 1 − x2x+x3x 1 − x3x = −x · dx ((1 − x1x) (1 − x2x) (1 − x3x)) (1 − x1x) (1 − x2x) (1 − x3x)= −x ·c1 + 2c2x + 3c3x2 1 + c1x + c2x2 + c3x3 = −c1x + 2c2x2 + 3c3x3 1 + c1x + c2x2 + c3x3. Suy ra rằng X∞ k=1 Skxk ! 1 + c1x + c2x2 + c3x3 = −c1x + 2c2x2 + 3c3x3 , hay X∞ k=1 Skxk + X∞ k=1 Skxk ! c1x + c2x2 + c3x3 = −c1x + 2c2x2 + 3c3x3 . Nói cách khác, ta có X∞ Skxk = − k=1 X∞ k=1 Skxk ! c1x + c2x2 + c3x3 −c1x + 2c2x2 + 3c3x3 . (6) 78 Tạp chí Epsilon, Số 10, 08/2016 Vế trái của (6) được khai triển như sau S1x + S2x2 + S3x3 + S4x4 + S5x5 + · · · (7) Vế phải của (6) được viết lại dưới dạng −c1x− (S1c1 + 2c2) x2 − (S2c1 + S1c2 + 3c3) x3 − (S3c1 + S2c2 + S1c3) x4 − (S4c1 + S3c2 + S2c3) x5 − · · · (8) So sánh các hệ số tương ứng của (7) và (8), ta thu được  S1 = −c1, S2 = −S1c1 − 2c2, S3 = −S2c1 − S1c2 − 3c3, S4 = −S3c1 − S2c2 − S1c3,  S5 = −S4c1 − S3c2 − S2c3, . . . Sk = −Sk−1c1 − Sk−2c2 − Sk−3c3, k > 4. hay  S1 + c1 = 0, S2 + S1c1 + 2c2 = 0, S3 + S2c1 + S1c2 + 3c3 = 0, S4 + S3c1 + S2c2 + S1c3 = 0,  S5 + S4c1 + S3c2 + S2c3 = 0, . . . Sk + Sk−1c1 + Sk−2c2 + Sk−3c3 = 0, k > 4. 1.2. Đồng nhất thức Newton, trường hợp tổng quát Giả sử x1, x2, . . . , xn là n số thực xác định. Đặt  c1 = − (x1 + x2 + · · · + xn) c2 = x1x2 + x1x3 + · · · + xn−1xn c3 = − (x1x2x3 + x1x2x4 + · · · + xn−2xn−1xn)  . . . cn = (−1)nx1x2x3 · · · xn 79 Tạp chí Epsilon, Số 10, 08/2016 và Sk = x1k + x2k + · · · + xnk; k = 1, 2, 3, . . . , n, n + 1, n + 2, . . . Ta có đồng nhất thức sau   S1 + c1 = 0, S2 + S1c1 + 2c2 = 0, . . . Sn + Sn−1c1 + · · · + S1cn−1 + ncn = 0, Sk + Sk−1c1 + · · · + S1ck−1 = 0, ∀k > n + 1. Đồng nhất thức trên được gọi là đồng nhất thức Newton. Dựa vào cách thiết lập đồng nhất thức Newton trong trường hợp n = 3, ta có cách chứng minh sau đây cho đồng nhất thức Newton, trong trường hợp n bất kì. Ta cóYn i=1 Trong (9), thay x bởi 1x, ta có (x − xi) = xn +Xn−1 i=0 cn−ixi. (9) Yn i=1 1 x− xi =1xn+Xn−1 i=0 cn−i xi, hayQn i=1 Quy đồng và rút gọn, ta được (1 − xix) xn=1xn+Xn−1 i=0 cn−i xi. Yn i=1 (1 − xix) = 1 +Xn i=1 cixi. (10) Bây giờ, xét chuỗi lũy thừa “hình thức” X∞ k=1 Skxk. 80