🔙 Quay lại trang tải sách pdf ebook AI Trong Cuộc Cách Mạng Công Nghệ 4.0 - Ajay Agrawal & Joshua Gans & Avi Goldfarb full prc pdf epub azw3 [Kinh Tế]
Ebooks
Nhóm Zalo
Mục lục
1. 1. Giới thiệu - Trí tuệ nhân tạo
2. 2. Giá thành rẻ thay đổi tất cả
3. PHẦN 1 - SỰ DỰ ĐOÁN
4. 3. Sự kì diệu của máy dự đoán
5. 4. Vì sao lại gọi là trí tuệ?
6. 5. Dữ liệu là nguyên liệu mới
7. 6. Sự phân chia lao động mới
8. PHẦN 2 - QUÁ TRÌNH ĐƯA RA QUYẾT ĐỊNH 9. 7. Mở ra những quyết định
10. 8. Giá trị của sự đánh giá
11. 9. Dự đoán sự đánh giá
12. 10. Chế ngự sự phức tạp
13. 11. Những quyết định được tự động hóa hoàn toàn 14. PHẦN 3 - CÔNG CỤ
15. 12. Tái xây dựng luồng công việc
16. 13. Phân tích những quyết định
17. 14. Thiết kế lại công việc
18. PHẦN 4 - CHIẾN LƯỢC
19. 15. Ai trong bộ máy quản lý cao cấp
20. 16. Khi AI thay đổi doanh nghiệp của bạn 21. 17. Chiến lược học hỏi của bạn
22. 18. Quản lý rủi ro AI
23. PHẦN 5 - XÃ HỘI
24. 19. Vượt xa hơn việc kinh doanh
25. Lời cảm ơn
26. Chú thích
Tới gia đình của chúng tối, những người đồng nghiệp, những người học trò và những công ty khởi nghiệp đã truyền cảm hứng để chúng tôi suy nghĩ sáng suốt và sâu sắc về trí tuệ nhân tạo.
1Giới thiệu - Trí tuệ nhân tạo
N
ếu viễn cảnh sau đây nghe chưa quen thuộc, thì nó sẽ sớm thôi. Một đứa trẻ làm bài tập về nhà một mình ở trong phòng. Một câu hỏi vang lên: “Đâu là thủ phủ của Delaware?”. Bố mẹ đứa trẻ bắt đầu nghĩ: “Baltimore… rõ ràng là vậy mà… Wilmington… không phải là thủ phủ.” Nhưng trước khi bố mẹ đứa trẻ kịp nghĩ ra, một cỗ máy thông minh tên Alexa đã nói ra câu trả lời chính xác: “Thủ phủ của Delaware là Dover.” Alexa là chiếc máy trí tuệ nhân tạo của Amazon, hay còn gọi là AI, nó có thể phiên dịch ngôn ngữ tự nhiên và cung cấp câu trả lời cho những câu hỏi với tốc độ ánh sáng. Alexa đã thay thế các bậc phụ huynh với tư cách là nguồn thông tin dồi dào dưới con mắt của con trẻ.
AI có mặt ở mọi nơi. AI ở trong điện thoại, xe ô tô của chúng ta, ở trong những trải nghiệm mua sắm, hẹn hò, ở trong bệnh viện, ngân hàng và ở trên các tin tức. Vì vậy, chẳng lạ gì khi các giám đốc doanh nghiệp, giám đốc điều hành, phó chủ tịch, quản lý, trưởng nhóm, các nhà khởi nghiệp, nhà đầu tư, tư vấn viên, nhà hoạch định chính sách đang trong cuộc chạy đua để tìm hiểu về AI: họ đều nhận ra rằng nó sẽ gây ra những thay đổi thiết yếu lên doanh nghiệp của họ.
Ba người chúng tôi đã quan sát những sự phát triển của AI từ một điểm nhìn đặc biệt có lợi. Chúng tôi là những nhà kinh tế học đã xây dựng sự nghiệp nhờ việc nghiên cứu cách mạng công nghệ tuyệt vời nhất: Internet. Qua nhiều năm nghiên cứu, chúng tôi đã học cách cắt lược những sự cường điệu hoá để tập trung vào ý nghĩa của công nghệ với những người đưa ra quyết định.
Chúng tôi cũng đã xây dựng Creative Destruction Lab (CDL), một chương trình đang ở giai đoạn khởi đầu nhằm giúp tăng khả năng thành công cho các dự án khởi nghiệp liên quan tới khoa học. Ban đầu, CDL được dành cho tất cả các dự án khởi nghiệp, nhưng tới năm 2015, rất nhiều trong số những thương vụ đáng mong chờ nhất đều là những công ty được vận hành nhờ AI. Cho tới tháng 9 năm 2017, CDL đã trở thành một công ty tập trung nhiều nhất các dự án khởi nghiệp về AI trên thế giới trong vòng ba năm liên tiếp.
Bởi vậy, rất nhiều lãnh đạo trong ngành thường xuyên tới Toronto để tham gia vào CDL. Ví dụ, một trong những nhà đầu tư chính của chương trình AI nền tảng cho Alexa Amazon, William Tunstall-Pedoe, cứ cách tám tuần lại
bay từ Cambridge, Anh tới Toronto để tham gia cùng chúng tôi trong suốt thời gian dự án. Barney Pell ở San Francisco, người đã từng đứng đầu một đội gồm 85 người ở NASA phóng AI đầu tiên vào vũ trụ, cũng vậy.
Lí do cho ưu thế của CDL trong lĩnh vực này một phần do địa điểm của chúng tôi ở Toronto, nơi mà rất nhiều phát minh nòng cốt mang lại nhiều sự quan tâm gần đây tới AI – trong lĩnh vực được gọi là “máy tự học” – được ươm mầm và nuôi dưỡng. Những chuyên gia đã từng làm việc tại bộ phận khoa học máy tính tại Đại học Toronto hiện đang dẫn dắt một số đội ngũ công nghiệp AI hàng đầu trên thế giới, bao gồm những nhân tài ở Facebook, Apple và Open AI của Elon Musk.
Vì được tiếp xúc với rất nhiều ứng dụng của AI, chúng tôi có động lực tập trung nghiên cứu về sự ảnh hưởng đến chiến lược kinh doanh của loại hình công nghệ này. Như chúng tôi sẽ lí giải ở các chương sau, AI là công nghệ mang tính dự đoán, những dự đoán là thông tin đầu vào của quá trình quyết
định và nền kinh tế đã cung cấp một khuôn mẫu hoàn hảo để hiểu rõ hơn về những sự đánh đổi nằm sau mỗi quyết định. Vậy nên, nhờ sự may mắn, chúng tôi nhận thấy bản thân đang ở đúng chỗ, đúng thời điểm để tạo cầu nối giữa chuyên gia công nghệ và người làm kinh doanh. Cuốn sách này chính là thành quả của chúng tôi.
Sự nhìn nhận quan trọng đầu tiên của chúng tôi là làn sóng mới của trí tuệ nhân tạo không thực sự mang lại cho chúng ta trí tuệ mà là một thành phần quan trọng của trí tuệ - sự dự đoán. Điều mà Alexa đã làm khi một đứa trẻ đặt ra một câu hỏi là nghe thấy âm thanh, dự đoán những từ ngữ mà đứa trẻ nói rồi dự đoán thông tin mà những từ ngữ đang tìm kiếm. Alexa không “biết” thủ phủ của Delaware là gì. Nhưng Alexa có khả năng dự đoán, khi con người hỏi một câu hỏi như vậy, nó biết tìm kiếm câu trả lời cụ thể: “Dover”.
Mỗi dự án khởi nghiệp trong phòng thí nghiệm của chúng tôi đều dựa vào việc khai thác những lợi ích của việc dự đoán tốt hơn. Deep Genomics nâng cao hoạt tính của thuốc thông qua việc dự đoán điều gì sẽ xảy ra trong một tế bào khi ADN bị biến đổi. Chisel nâng cao tính năng của pháp luật thông qua việc dự đoán phần nào trong văn bản cần biên soạn lại. Validere nâng cao
hiệu quả của chuyển giao dầu bằng cách dự đoán hàm lượng nước của dầu thô. Những ứng dụng này chỉ là một phần nhỏ so với hầu hết những điều mà các doanh nghiệp sẽ làm trong tương lai gần.
Nếu bạn bị đang lạc lối trong việc tìm ra ý nghĩa của AI, chúng tôi có thể giúp bạn hiểu được ý nghĩa của AI và dẫn lối bạn tìm hiểu những tiến bộ trong công nghệ này.
Nếu bạn là một nhà lãnh đạo doanh nghiệp, chúng tôi sẽ giúp bạn hiểu về tác động của AI đối với công tác quản lý và các quyết định. Nếu bạn là sinh viên hay vừa mới tốt nghiệp, chúng tôi sẽ cung cấp cho bạn một khuôn mẫu để bạn suy nghĩ về sự tiến hóa của các công việc và ngành nghề trong tương lai. Nếu bạn là một chuyên gia phân tích tài chính hoặc nhà đầu tư mạo hiểm, chúng tôi sẽ cung cấp một cấu trúc mà dựa vào đó bạn có thể phát triển các luận điểm đầu tư.
Nếu bạn là nhà hoạch định chính sách, chúng tôi sẽ cung cấp hướng dẫn để bạn hiểu cách AI có thể thay đổi xã hội ra sao và những chính sách có thể định hình những thay đổi mang hướng tốt hơn như thế nào.
Kinh tế cung cấp một nền tảng vững chắc để hiểu về sự bất định và ý nghĩa của nó đối với quá trình đưa ra quyết định. Vì dự đoán tốt hơn sẽ làm giảm sự do dự, chúng tôi sử dụng nền kinh tế để giúp bạn hiểu rõ ý nghĩa của AI đối với các quyết định bạn đưa ra trong quá trình kinh doanh của bạn. Điều này sẽ cung cấp sự nhận thức sâu sắc về những công cụ AI nào có khả năng mang lại lợi nhuận đầu tư cao nhất cho dòng chảy trong công việc kinh doanh của bạn. Từ đó dẫn đến một khuôn mẫu cho việc xây dựng chiến lược kinh doanh, chẳng hạn như cách bạn có thể suy nghĩ lại quy mô và phạm vi doanh nghiệp của mình để khai thác những vấn đề thực tế của kinh tế mới dựa trên dự đoán. Cuối cùng, chúng tôi chia nhỏ những sự đánh đổi liên quan đến AI trong công việc, trong sự tập trung quyền lực của sức mạnh đoàn thể, trong quyền riêng tư và trong địa chính trị.
Những dự đoán nào quan trọng đối với doanh nghiệp của bạn? Những tiến bộ trong AI sẽ thay đổi những dự đoán của bạn như thế nào? Ngành của bạn sẽ thiết kế lại các công việc như thế nào để đáp ứng những tiến bộ trong công nghệ dự đoán, giống như cách các ngành nghề định hình lại công việc với sự phát triển của máy tính cá nhân và rồi là Internet? AI vẫn còn là một khái
niệm mới và vẫn chưa được hiểu một cách rõ ràng, nhưng công cụ kinh tế để đánh giá tác động của việc giảm chi phí dự đoán là chắc chắn; mặc dù những ví dụ chúng tôi sử dụng rồi cũng sẽ trở nên lỗi thời, nhưng khuôn mẫu được đề cập trong cuốn sách này thì không. Những sự nhận thức sâu sắc sẽ tiếp tục được áp dụng khi công nghệ phát triển và những dự đoán trở nên chính xác, phức tạp hơn.
Trí tuệ nhân tạo và cuộc cách mạng trong kinh doanh không phải là công thức để thành công trong nền kinh tế AI. Thay vào đó, chúng tôi nhấn mạnh tới những sự đánh đổi liên quan đến AI. Nhiều dữ liệu hơn đồng nghĩa với việc ít quyền riêng tư hơn. Tốc độ nhanh hơn đồng nghĩa với độ chính xác thấp hơn. Quyền tự chủ cao hơn đồng nghĩa với việc ít sự kiểm soát hơn. Chúng tôi không áp đặt chiến lược tốt nhất cho doanh nghiệp của bạn. Đó là công việc của bạn. Chiến lược tốt nhất cho doanh nghiệp, nghề nghiệp hoặc đất nước của bạn sẽ dựa vào cách bạn cân nhắc mỗi mặt của sự đánh đổi. Cuốn sách này cung cấp cho bạn khuôn mẫu để xác định những sự đánh đổi chính và cách đánh giá ưu điểm, nhược điểm để bạn có thể đi tới quyết định tốt nhất. Tất nhiên, ngay cả khi đã có khuôn mẫu của chúng tôi trong tay, bạn vẫn sẽ thấy mọi thứ thay đổi nhanh chóng. Bạn sẽ phải đưa ra quyết định ngay cả khi không có thông tin đầy đủ, nhưng làm vậy còn tốt hơn là không làm gì.
NHỮNG ĐIỂM CHÍNH
• Làn sóng mới của trí tuệ nhân tạo không thực sự mang đến cho chúng ta trí tuệ mà thay vào đó là một thành phần quan trọng của trí tuệ - sự dự đoán
• Sự dự đoán là dữ liệu đầu vào quan trọng của quá trình đưa ra quyết định. Nền kinh tế cho chúng ta một khuôn mẫu đã được xây dựng đầy đủ để hiểu rõ về quá trình đưa ra quyết định. Những tác động còn mới và chưa được hiểu rõ trong sự tiến bộ của công nghệ dự đoán có thể được kết hợp cùng với logic lý thuyết quyết định cũ và quen thuộc của nền kinh tế để mang lại những sự thấu hiểu sâu sắc, giúp định hướng cách tiếp cận AI cho tổ chức của bạn.
• Thường sẽ không có một câu trả lời đúng cho câu hỏi đâu là kế hoạch AI tốt nhất hay những công cụ AI nào tốt nhất, vì AI bao gồm những sự đánh đổi: tốc độ nhanh hơn thì ít chính xác hơn; quyền tự chủ cao hơn thì ít sự kiểm soát hơn; nhiều dữ liệu hơn thì ít quyền riêng tư hơn. Chúng tôi cung cấp cho
bạn một phương pháp để xác định những sự đánh đổi với mỗi quyết định liên quan tới AI để bạn có thể đánh giá hai mặt ưu – nhược của mỗi sự đánh đổi sao cho phù hợp với sứ mệnh và mục tiêu của tổ chức, từ đó đưa ra quyết định tốt nhất cho bạn.
2Giá thành rẻ thay đổi tất cả
A
i cũng đã từng có hoặc sẽ sớm tiếp xúc với AI. Chúng ta đã quen với phương tiện truyền thông ngập tràn những câu chuyện về công nghệ mới sẽ thay đổi cuộc sống của chúng ta. Trong khi những người là dân kỹ thuật vui mừng trước những tiềm năng mới trong tương lai và những người bài xích công nghệ thì thương nhớ những ngày tốt đẹp đã qua, đa số chúng ta đã quen với nhịp thay đổi của các thông tin về công nghệ đến mức chúng ta vô cảm mà nói rằng điều duy nhất miễn nhiễm với sự thay đổi chính là thay đổi. Cho tới khi chúng ta tiếp xúc với AI. Lúc đó chúng ta sẽ nhận ra rằng công nghệ này thực sự khác biệt.
Một vài nhà khoa học máy tính có trải nghiệm tiếp xúc với AI vào năm 2012 khi một nhóm học sinh tới từ Đại học Toronto chiến thắng đầy ấn tượng trong cuộc thi nhận dạng đồ vật bằng thị giác mang tên Image-Net, họ khiến tất cả những đội lọt vào chung kết năm sau sử dụng cách tiếp cận học sâu - được coi là mới ở thời điểm đó - để cạnh tranh. Nhận dạng đồ vật không chỉ đơn thuần là một trò chơi; công nghệ đó giúp các loại máy móc có thể “nhìn” được.
Một số giám đốc điều hành công nghệ tiếp xúc với AI khi họ đọc được tiêu đề báo vào tháng 1 năm 2014 về việc Google vừa mới trả hơn 600 triệu đô la để thu mua công ty DeepMind tại Anh, mặc dù công ty khởi nghiệp mới này chỉ tạo ra doanh thu không đáng kể so với giá mua nhưng đã thể hiện được rằng, công nghệ AI của họ đã tự học, mà không cần phải lập trình, để chơi một số trò chơi của Atari với hiệu suất nhanh hơn con người.
Một vài công dân bình thường đã có trải nghiệm tiếp xúc với AI sau khi nhà vật lý học nổi tiếng Stephen Hawking giải thích nhấn mạnh rằng: “Tất cả những điều mà nhân loại có thể đem lại chính là sản phẩm của trí tuệ con người… Thành công trong việc tạo ra AI sẽ là sự kiện lớn nhất trong lịch sử loài người.”1
Một số khác đã có trải nghiệm tiếp xúc với AI lần đầu khi họ không cần dùng
tay để điều khiển chiếc Tesla đang chạy và điều hướng giao thông với công nghệ lái xe tự động (AI Autopilot).
Chính phủ Trung Quốc đã tiếp xúc với AI khi họ chứng kiến công nghệ AI của DeepMind, AlphaGo, đánh bại Lee Se-dol, kì thủ cờ vây bậc thầy người Hàn Quốc , rồi sau đó cùng năm đánh bại kì thủ giỏi hàng đầu thế giới, Ke Jie của Trung Quốc. Báo New York Times gọi trận đấu đó như là “thời khắc Sputnik”2của Trung Quốc. Giống như sự đầu tư hàng loạt của Mỹ vào khoa học sau sự kiện Liên Xô ra mắt tên lửa Sputnik, Trung Quốc đáp lại sự kiện này bằng kế hoạch mang tầm vóc quốc gia nhằm thống trị AI vào năm 2030 và cam kết bằng tài chính để tuyên bố đó được hiện thực hoá.
Trải nghiệm tiếp xúc với AI của chúng tôi là vào năm 2012 khi một lượng nhỏ và rồi số lượng lớn các công ty AI áp dụng kỹ thuật machine- learning (học máy) tân tiến vượt bậc cho CDL. Những ứng dụng này đã mở rộng các ngành công nghiệp – phát triển các loại thuốc mới, dịch vụ khách hàng, dây chuyền sản xuất, đảm bảo chất lượng, hệ thống bán lẻ, thiết bị y tế. Công nghệ này vừa có sức ảnh hưởng mạnh mẽ vừa có tính mục đích tổng quan, nó có thể đem lại giá trị quan trọng thông quan một loạt các loại hình ứng dụng. Chúng tôi bắt đầu với mục tiêu hiểu rõ điều đó có ý nghĩa gì về mặt kinh tế. Chúng tôi biết rằng AI sẽ bị ảnh hưởng giống như nền kinh tế hay các loại công nghệ khác.
Bản chất của nó, đơn giản mà nói, rất tuyệt vời. Khi AI mới xuất hiện, nhà đầu tư mạo hiểm nổi tiếng Steve Jurvetson nói rằng: “Bất kỳ sản phẩm nào khiến bạn cảm thấy tuyệt vời như một phép màu đều sẽ được xây dựng bởi những thuật toán này.”3 Sự nhân cách hoá AI như một “phép màu” của
Jurvetson đồng điệu với những câu chuyện nổi tiếng về AI trong những bộ phim như 2001: A Space Odyssey (Du hành không gian), Star Wars (Chiến trang giữa các vì sao), Blade Runner (Tội phạm nhân bản), và những bộ phim gần đây như Her (Hạnh phúc ảo), Transcendence (Trí tuệ siêu việt), và Ex Machina (Cỗ máy). Chúng tôi hiểu và đồng cảm với sự nhân cách hoá những ứng dụng của AI như là “phép màu” của Jurvetson. Với tư cách là những nhà kinh tế học, công việc của chúng tôi là biến những ý tưởng có vẻ kì diệu thành đơn giản, rõ ràng và thực tiễn.
Hiểu rõ về những sự thổi phồng
Các nhà kinh tế học nhìn thế giới khác với đa số mọi người. Chúng tôi nhìn mọi thứ qua một khuôn mẫu được quyết định bởi những yếu tố như lượng cung và cầu, sản xuất và tiêu thụ, giá cả và chi phí. Tuy các nhà kinh tế thường không đồng ý với quan điểm của nhau, chúng tôi làm vậy dựa trên một khuôn mẫu chung. Chúng tôi tranh luận về những giả định và sự diễn giải, chứ không phải về những khái niệm cơ bản như vai trò của sự khan hiếm và cạnh tranh khi định giá. Cách tiếp cận này đã đem lại cho chúng tôi một điểm nhìn thuận lợi đầy độc đáo khi nhìn thế giới. Về mặt nhược điểm, quan điểm của chúng tôi khá khô khan. Còn về mặt ưu điểm, quan điểm của chúng tôi cung cấp một sự rõ ràng hữu ích cho việc đưa ra quyết định của doanh nghiệp.
Hãy bắt đầu với điều cơ bản - giá cả. Khi giá cả của một sản phẩm nào đó giảm, chúng ta mua sắm nhiều hơn. Đó là những nguyên lý kinh tế đơn giản và đang diễn ra với AI. AI ở khắp mọi nơi – trong những ứng dụng trên điện thoại của bạn, tối ưu hoá mạng lưới điện của bạn và thay thế người quản lý danh mục đầu tư chứng khoán của bạn. Có lẽ sớm thôi AI sẽ lái xe đưa đón bạn và mang các kiện hàng tới nhà bạn.
Nếu các nhà kinh tế học giỏi ở điều gì, thì đó chính là việc bỏ qua những sự thổi phồng. Khi những người khác nhìn thấy sự đổi mới, chúng tôi nhìn thấy sự giảm giá thành. Nhưng còn hơn thế nữa. Để hiểu cách AI ảnh hưởng lên tổ chức của bạn, bạn cần biết chính xác giá thành đã thay đổi ra sao và cách giá thành thay đổi sẽ ảnh hưởng tới nền kinh tế rộng lớn như thế nào. Chỉ khi đó bạn mới có thể xây dựng kế hoạch hành động. Lịch sử của nền kinh tế đã dạy cho chúng tôi rằng, ảnh hưởng của những sự đổi mới lớn thường được cảm nhận ở những nơi bất ngờ nhất.
Hãy cùng nhau xem xét câu chuyện của Internet thương mại vào năm 1995. Trong khi đa số chúng ta đều đang xem Seinfeld, Microsolf ra mắt Windows 95, hệ thống điều hành đa nhiệm đầu tiên của công ty. Vào cùng năm, chính
phủ Hoa Kỳ đã bỏ những lệnh cấm cuối cùng để thực hiện lưu lượng truy cập thương mại trên mạng Internet, và Netscape – công ty phát minh ra trình duyệt – ăn mừng lần đầu phát hành cổ phiếu ra công chúng (IPO) của mạng Internet thương mại. Sự kiện này đánh dấu sự thay đổi khi mạng Internet chuyển từ sự tò mò về công nghệ đơn thuần sang làn sóng thương mại có thể cuốn trôi nền kinh tế.
IPO của Netscape đã khiến công ty có trị giá hơn 3 tỷ đô la, cho dù công ty chưa thực sự tạo ra lợi nhuận đáng kể nào. Các nhà đầu tư vốn mạo hiểm định giá các công ty khởi nghiệp bằng những con số triệu đô cho dù họ đang ở mức “tiền doanh thu”, đây từng là một định nghĩa mới. Những cử nhân mới tốt nghiệp với tấm bằng MBA từ chối những công việc truyền thống đầy hấp dẫn để tìm kiếm những cơ hội trên các trang web. Khi sự ảnh hưởng của mạng Internet bắt đầu lan rộng khắp các ngành nghề và làm biến đổi chuỗi giá trị, những người ủng hộ công nghệ dừng việc gọi mạng Internet là một loại hình công nghệ mới và bắt đầu đề cập tới mạng Internet như là một “Nền Kinh Tế Mới”. Mạng Internet vượt qua cả công nghệ và lan toả vào những hoạt động của con người ở mức độ quan trọng. Những chính trị gia, lãnh đạo công ty, nhà đầu tư, doanh nhân khởi nghiệp và những hãng tin tức lớn bắt đầu sử dụng thuật ngữ này. Tất cả mọi người đều bắt đầu sử dụng thuật ngữ Nền Kinh Tế Mới.
Tất cả mọi người, ngoại trừ những chuyên gia kinh tế. Chúng tôi không nhìn thấy một nền kinh tế mới. Với những chuyên gia kinh tế, nó chỉ là nền kinh tế bình thường mà thôi. Có một điều chắc chắn là một vài sự thay đổi quan trọng đã xảy ra. Hàng hoá và dịch vụ có thể được phân phối thông qua các kênh kĩ thuật số. Giao tiếp trở nên dễ dàng hơn và bạn có thể tìm thấy thông tin chỉ với cú bấm chuột vào nút tìm kiếm. Nhưng trước đây bạn cũng có thể làm được tất cả những điều này. Điều thay đổi đó là giờ bạn có thể làm điều đó với giá thành rẻ hơn. Sự phát triển của Internet mang theo sự giảm giá thành trong việc phân phối, giao tiếp và tìm kiếm. Định hình một sự phát triển công nghệ như là một sự thay đổi từ giá thành đắt đỏ tới giá thành rẻ, hoặc từ hiếm có tới dồi dào là rất quan trọng cho việc suy nghĩ về cách mà nó sẽ ảnh hưởng đến doanh nghiệp của bạn. Ví dụ, nếu bạn nhớ lại lần đầu tiên bạn sử dụng Google, bạn có thể sẽ nhớ việc đã bị mê hoặc bởi khả năng tưởng như kì diệu của việc truy cập thông tin. Theo quan điểm của một chuyên gia kinh tế, Google đã khiến việc tìm kiếm thông tin trở nên rẻ hơn. Khi giá thành của việc tìm kiếm thông tin trở nên rẻ hơn, các công ty từng kiếm được tiền bán hàng thông qua nhiều phương tiện khác nhau (ví dụ: những Trang vàng, đại lý du lịch, mẩu tin quảng cáo), cảm thấy đang phải đối mặt với những sự cạnh tranh lớn. Trong khi đó, các công ty kinh doanh phụ thuộc vào việc được người khác tìm kiếm (ví dụ, những tác giả tự xuất bản, những người bán đồ sưu tầm, những người sản xuất phim tại gia) lại trở nên thành công.
Sự thay đổi trong giá thành của một số hoạt động nhất định đã ảnh hưởng mạnh mẽ đến mô hình kinh doanh của một vài công ty và thậm chí thay đổi một số ngành công nghiệp. Tuy nhiên, luật kinh tế vẫn không thay đổi. Chúng tôi vẫn có thể hiểu tất cả mọi thứ khi nói về vấn đề cung và cầu, đồng thời vẫn có thể đặt ra chiến lược, thông báo chính sách, đồng thời hy vọng vào tương lai sử dụng những quy luật kinh tế với mô hình có sẵn.
Giá thành rẻ có ở khắp mọi nơi
Khi giá thành của một thứ gì đó mang tính thiết yếu giảm mạnh, toàn bộ thế giới có thể thay đổi. Ví dụ như ánh sáng. Có thể là bạn đang đọc cuốn sách này dưới ánh sáng nhân tạo. Hơn nữa, có thể bạn chưa bao giờ nghĩ tới việc
sử dụng ánh sáng nhân tạo để đọc lại đáng quý như vậy. Ánh sáng có giá thành rẻ nên bạn có xu hướng không coi trọng nó. Nhưng, như chuyên gia kinh tế học William Nordhaus đã tỉ mỉ nghiên cứu, vào những năm đầu thế kỉ 18, bạn sẽ phải tốn gấp 400 lần số tiền bạn đang trả bây giờ để sử dụng nguồn điện tương đương.4 Với số tiền đó, bạn sẽ chú ý hơn tới giá thành của điện và sẽ phải suy nghĩ trước khi sử dụng ánh sáng nhân tạo để đọc cuốn sách này. Sự giảm giá thành của điện đã thắp sáng thế giới. Không những điện biến ban đêm thành như ban ngày, mà nó còn giúp chúng ta sinh sống và làm việc trong những tòa nhà lớn mà ánh sáng tự nhiên khó có thể lọt vào. Chúng ta gần như không phát triển như ngày hôm nay nếu giá thành của ánh sáng nhân tạo không giảm nhiều đến vậy.
Những thay đổi trong công nghệ giúp những thứ đã từng đắt nay trở nên rẻ. Giá thành của điện giảm tới mức giờ chúng ta không còn bận tâm về việc bật nút công tắc điện. Việc giá thành giảm đáng kể như vậy tạo cơ hội cho chúng ta làm những việc trước đây không thể; nó có thể khiến những việc không thể trở thành có thể. Vậy nên, không ngạc nhiên khi những chuyên gia kinh tế học đều ám ảnh về những hệ luỵ của việc giảm giá thành đáng kể của những sản phẩm đầu vào thiết yếu như điện.
Tim Bresnahan, chuyên gia kinh tế học của Đại học Stanford và cũng là cố vấn của chúng tôi, chỉ ra rằng máy tính chỉ thực hiện các thuật toán và chỉ có vậy. Sự ra đời và thương mại hoá của máy tính khiến các thuật toán trở nên rẻ hơn.5 Khi giá thành của các thuật toán trở nên rẻ hơn, chúng ta không những sử dụng nhiều hơn những ứng dụng thuật toán truyền thống mà chúng ta còn
sử dụng các thuật toán mới, có giá thành rẻ hơn trong những ứng dụng mà vốn không liên quan đến thuật toán, ví dụ như là âm nhạc.
Ada Lovelace là người đầu tiên nhìn thấy tiềm năng của việc trở thành lập trình viên máy tính đầu tiên. Làm việc dưới ánh điện đắt đỏ của những năm đầu thế kỷ 19, bà đã viết những chương trình được ghi nhận đầu tiên để tính toán những chuỗi số (được gọi là chuỗi số Bernoulli) cho chiếc máy tính “giả tưởng” do Charles Babbage thiết kế. Babbage cũng là một chuyên gia kinh tế học, và như bạn sẽ thấy trong cuốn sách này, đây không phải là lần duy nhất mà kinh tế học và khoa học máy tính có sự liên kết với nhau. Lovelace nhận thức được rằng thuật toán có thể - nếu nói theo ngôn ngữ khởi nghiệp hiện đại - tính toán quy mô và có khả năng làm được nhiều điều hơn thế. Bà nhận ra rằng những ứng dụng của máy tính không chỉ giới hạn trong những việc thực hành toán học: “Giả dụ, nếu những mối liên hệ cơ bản của âm thanh cao độ trong hoà âm và sáng tác âm nhạc đều dễ bị ảnh hưởng bởi những biểu hiện và những ứng dụng như vậy, thì máy móc có thể sáng tác những bản nhạc chau chuốt và khoa học ở bất kỳ mức độ khó dễ nào.”6 Khi đó máy tính chưa được phát minh, nhưng Lovelace đã hình dung ra chiếc máy sử dụng thuật toán để có thể lưu trữ và phát lại nhạc – một hình thức máy móc có tính thách thức nghệ thuật và nhân loại.
Đó chính xác là những gì đã xảy ra. Khi mà một thế kỷ rưỡi sau, giá thành của thuật toán sụt giảm và hàng ngàn ứng dụng của thuật toán mà hầu hết chưa ai từng mơ tới đã ra đời. Thuật toán là dữ liệu đầu vào quan trọng dẫn đến nhiều điều khác, khi giá thành của nó trở nên rẻ, cũng giống như điện trước đó, nó đã thay đổi thế giới. Việc nhìn mọi thứ thông qua góc nhìn giảm giá thành đã giúp chúng tôi lược bỏ những sự cường điệu hóa, tuy nhiên nó không khiến loại hình công nghệ mới nhất và tuyệt vời nhất trở nên thú vị. Bạn sẽ không bao giờ thấy cảnh Steve Jobs tuyên bố về “một loại máy móc mới”, cho dù đó là những gì ông đã làm. Bằng việc giảm giá thành của một điều gì đó quan trọng, những loại máy móc mới của Jobs thực sự mang tính đột phá.
Điều đó dẫn chúng ta đến với AI. AI có tầm quan trọng về mặt kinh tế vì nó giúp một điều gì đó quan trọng trở nên rẻ hơn. Bạn có thể tưởng tượng những chú robot hoặc những sinh vật không có thật, ví dụ như những máy tính thân thiện trong Star Trek (Du hành giữa các vì sao), giúp bạn tránh việc nghĩ ngợi
không cần thiết. Lovelace cũng có suy nghĩ tương tự, nhưng lại nhanh chóng gạt bỏ nó. Ít nhất là khi nói về máy tính, bà đã viết, nó “không có sự căng thẳng khi làm bất kỳ việc gì. Nó có thể làm bất kỳ điều gì mà chúng ta yêu cầu nó thực hiện. Nó có thể theo dõi phân tích, nhưng nó không có khả năng dự đoán bất kỳ sự liên quan đến việc phân tích hay sự thật.”7
Với tất cả những sự cường điệu hoá liên quan tới khái niệm AI, điều mà Alan Turing*sau này gọi là “Sự phản đối của quý bà Lovelace” vẫn đúng. Máy tính vẫn không có khả năng suy nghĩ, vậy nên suy nghĩ sẽ không trở nên rẻ hơn. Tuy nhiên, thứ sẽ có giá thành rẻ sẽ là một thứ có độ phổ biến rộng, giống như thuật toán, bạn sẽ không thể ngờ rằng nó lại thông dụng đến vậy và sự giảm giá thành của nó có thể ảnh hưởng tới cuộc sống của chúng ta và nền kinh tế.
* Alan Mathison Turing (23/6/1912 – 7/6/1954) là một nhà toán học, logic học và mật mã học người Anh. Ông thường được xem là cha đẻ của ngành khoa học máy tính.
Liệu còn điều gì mà AI có thể khiến giá thành trở nên rẻ hơn? Sự dự đoán. Vậy nên, giống như những gì mà nền kinh tế cho thấy, chúng ta không những sẽ sử dụng sự dự đoán nhiều hơn, mà chúng ta thậm chí còn ngạc nhiên khi thấy sự xuất hiện của nó ở nhiều vị trí mới.
Giá thành rẻ mang lại giá trị
Sự dự đoán là quá trình điền thông tin còn thiếu. Sự dự đoán sử dụng thông tin mà bạn có, thường được gọi là “dữ liệu”, và sử dụng nó để tạo ra thông tin bạn chưa có. Nhiều cuộc thảo luận về AI nhấn mạnh sự đa dạng trong kỹ thuật dự đoán với những cái tên và nhãn hiệu không rõ ràng như: sự phân loại, sự tụ chùm, sự hồi quy, cây quyết định, ước lượng Bayes, mạng lưới nơ ron, phân tích dữ liệu tô-pô, học sâu, học tăng cường, học sâu tăng cường, mạng lưới con nhộng… Những kỹ thuật này rất quan trọng với những chuyên gia công nghệ quan tâm tới việc triển khai AI vào một vấn đề dự đoán cụ thể. Trong cuốn sách này, chúng tôi sẽ lược bỏ những thuật toán đằng sau những phương pháp này. Chúng tôi nhấn mạnh rằng từng phương pháp đều liên quan đến dự đoán: sử dụng thông tin bạn có để tạo ra thông tin bạn chưa có. Chúng tôi tập trung vào việc giúp bạn nhận diện những tình huống mà sự dự
đoán sẽ có giá trị và cách khai thác được càng nhiều giá trị càng tốt từ dự đoán đó.
Giá thành của việc dự đoán rẻ hơn đồng nghĩa với việc sẽ có nhiều sự dự đoán hơn. Đó là nguyên lý kinh tế cơ bản: khi giá thành của thứ gì đó giảm, chúng ta có thể sử dụng nó nhiều hơn. Ví dụ, khi nền công nghiệp máy tính bắt đầu phổ biến vào những năm 1960 và giá thành của thuật toán bắt đầu giảm mạnh, chúng ta đã sử dụng nhiều thuật toán hơn trong các ứng dụng mà nó đã là thông tin đầu vào, ví dụ như tại Tổng cục điều tra Hoa Kỳ, Bộ Quốc phòng Hoa Kỳ, và NASA (gần đây đã được mô tả trong bộ phim Hidden Figures [tạm dịch: Số liệu ẩn]).
Tương tự vậy, sự dự đoán thường được dùng trong những công việc truyền thống, ví dụ như quản lý hàng hoá và dự báo nhu cầu. Quan trọng hơn, bởi vì giá thành của nó trở nên rẻ, nó được dùng cho những vấn đề mà trước đây chưa từng áp dụng sự dự đoán. Kathryn Howe của Integrate gọi khả năng có thể nhìn thấy vấn đề và biến nó thành vấn đề liên quan đến sự dự đoán là “sự thấu hiểu sâu sắc của AI”, và ngày nay, các kỹ sư trên khắp thế giới đều đang cố gắng đạt được điều đó.
Ví dụ, chúng ta biến vấn đề giao thông thành một vấn đề liên quan đến sự dự đoán. Những chiếc xe tự động hoá đã tồn tại trong môi trường có kiểm soát hơn hai thập kỷ nay. Tuy nhiên, chúng chỉ được sử dụng ở những nơi có sơ đồ hoạt động cụ thể như nhà máy và kho hàng. Những sơ đồ tầng lầu có nghĩa là các kỹ sư có thể thiết kế robot để vận dụng nguyên lý logic “nếu-thì” đơn giản: nếu một người bước tới trước xe thì nó sẽ tự dừng lại. Nếu phần ngăn còn trống thì di chuyển qua chỗ khác. Tuy nhiên, không ai có thể sử dụng những phương tiện này trên đường phố bình thường. Có quá nhiều lo ngại có thể xảy đến – có rất nhiều “nếu” để có thể mã hoá.
Những chiếc xe tự động hoá không thể hoạt động ở ngoài môi trường có khả năng dự đoán cao và mang tính kiểm soát như vậy – cho tới khi các kỹ sư bắt đầu coi sự điều hướng như một vấn đề liên quan đến sự dự đoán. Thay vì nói với máy móc phải làm những gì trong từng trường hợp, các kỹ sư nhận ra
rằng họ có thể tập trung vào từng vấn đề liên quan đến sự dự đoán: “Con người sẽ làm gì trong trường hợp đó?” Hiện giờ, các công ty đang đầu tư hàng tỷ đô la vào việc đào tạo máy móc lái xe tự động trong môi trường không kiểm soát, ngay cả trên đường phố và đường cao tốc.
Hãy thử tưởng tượng một chiếc máy AI ngồi trong xe cùng với tài xế là con người. Con người có thể lái xe hàng triệu dặm, nhận dữ liệu về môi trường thông qua mắt và tai của họ, xử lý dữ liệu bằng não bộ và rồi phản ứng lại với những dữ liệu: lái thẳng hay quẹo xe, phanh xe hay tăng tốc. Các kỹ sư sẽ cho AI đôi mắt và tai bằng cách trang bị cho xe những máy cảm biến (ví dụ như máy ảnh, ra-đa, la-de). Như vậy, AI có thể quan sát dữ liệu khi con người lái xe và đồng thời quan sát hành động của con người. Khi một dữ liệu cụ thể về yếu tố môi trường xuất hiện, con người sẽ rẽ phải, phanh, hay tăng tốc? AI càng quan sát con người nhiều, nó sẽ càng dự đoán hành động cụ thể mà người lái xe sẽ làm tốt hơn khi bị một yếu tố môi trường tác động. AI sẽ học cách lái xe thông qua việc dự đoán người lái xe sẽ làm gì trong những điều kiện cụ thể trên đường.
Quan trọng hơn, khi một dữ liệu đầu vào như sự dự đoán có giá thành rẻ, giá trị của những thứ khác cũng sẽ được nâng cao. Các chuyên gia kinh tế gọi đó là “sự bổ sung”. Giống như sự giảm giá thành của cafe sẽ khiến giá trị của đường và kem tăng, đối với những chiếc xe tự động hoá, sự giảm giá thành của sự dự đoán sẽ làm tăng giá trị của các máy cảm biến thu thập dữ liệu về môi trường xung quanh xe. Ví dụ, vào năm 2017, Intel trả hơn 15 tỷ đô la cho công ty khởi nghiệp Do Thái Mobileye, chỉ để mua công nghệ thu thập dữ liệu cho phép các phương tiện có thể nhìn thấy các vật thể (biển dừng xe, con người…) và các dấu hiệu (làn xe, đường) một cách hiệu quả.
Khi sự dự đoán có giá thành rẻ, sẽ càng có nhiều sự dự đoán và sự bổ sung liên quan đến dự đoán. Hai lực kinh tế đơn giản này dẫn đến những cơ hội mới mà máy dự đoán có thể tạo ra. Ở cấp độ thấp, máy dự đoán có thể làm
giảm bớt những công tác dự đoán của con người và tiết kiệm chi phí. Khi máy bắt đầu chuyển bánh, sự dự đoán có thể thay đổi và cải thiện chất lượng của quá trình đưa ra quyết định. Nhưng ở một điểm nào đó, máy dự đoán có thể chính xác và đáng tin đến mức nó có thể thay đổi cách một tổ chức hoạt động. Một số AI có thể sẽ ảnh hưởng đến tình hình kinh tế của doanh nghiệp đến mức chúng sẽ không còn được dùng đơn thuần để nâng cao hiệu suất trong việc thực hiện chiến lược mà bản thân chúng sẽ thay đổi chiến lược.
Từ giá thành rẻ đến chiến lược
Câu hỏi mà các giám đốc điều hành thường hỏi chúng tôi đó là: “AI sẽ ảnh hưởng đến chiến lược kinh doanh của chúng tôi như thế nào?” Chúng tôi sử
dụng thí nghiệm để trả lời câu hỏi đó. Hầu hết mọi người đã quen với việc mua sắm trên Amazon. Với hầu hết các nhà bán lẻ trực tuyến, bạn sẽ truy cập trang web của họ, mua sản phẩm, rồi đặt vào giỏ hàng, trả tiền và Amazon sẽ vận chuyển chúng đến cho bạn. Hiện giờ, mô hình kinh doanh của Amazon là mua hàng-rồi-vận chuyển. Trong quá trình bạn mua hàng, AI của Amazon đề xuất những món hàng mà nó dự đoán bạn sẽ muốn mua. AI này làm việc khá hiệu quả. Tuy nhiên, nó chưa thực sự hoàn hảo. Trong trường hợp của chúng ta, AI chỉ dự đoán chính xác nhứng gì chúng ta muốn mua vào khoảng 5%. Chúng ta thường mua khoảng một trong 20 món hàng mà nó đề xuất. Xét trên tổng số hàng triệu mặt hàng, như vậy không tệ chút nào!
Hãy tưởng tượng AI của Amazon thu thập nhiều thông tin hơn về chúng ta và sử dụng dữ liệu đó để cải thiện dự đoán của nó, một sự cải thiện giống như việc điều chỉnh âm lượng trên loa nhưng thay vì âm lượng, nó cải thiện độ chính xác của sự dự đoán của AI.
Ở một số điểm, khi nó điều chỉnh nút, độ chính xác của sự dự đoán của AI vượt ngưỡng, thay đổi mô hình kinh doanh của Amazon. Sự dự đoán trở nên đủ chính xác để Amazon thu về nhiều lợi nhuận hơn từ việc vận chuyển những món hàng nó dự đoán bạn sẽ muốn thay vì chờ bạn tự đặt hàng. Nhờ vậy, bạn sẽ không cần tới những điểm bán lẻ khác, và thực tế rằng món hàng đó có thể sẽ thúc đẩy bạn muốn mua nhiều hơn. Amazon sẽ chiếm được vị trí lớn trong ví tiền của bạn. Rõ ràng, điều này tốt cho Amazon, nhưng nó cũng sẽ tốt cho cả bạn. Amazon vận chuyển hàng tới bạn ngay trước cả khi bạn mua hàng, nếu tất cả mọi thứ đều diễn ra thuận lợi, nó sẽ giúp bạn hoàn thành toàn bộ việc mua sắm. Nút dự đoán thay đổi tăng khiến mô hình kinh doanh của Amazon từ mua hàng-rồi-vận chuyển sang vận chuyển- rồi-mua hàng.
Tất nhiên, những người mua hàng sẽ không muốn đối phó với những rắc rối của việc trả lại những món hàng họ không muốn. Vậy nên, Amazon đầu tư vào cơ sở hạ tầng cho việc trả hàng, có lẽ là những chiếc xe tải vận chuyển có tốc độc cao nhận đồ mỗi tuần một lần, thuận tiện cho việc thu thập lại những món hàng mà khách hàng không muốn.8
Nếu đây là mô hình kinh doanh tốt hơn, vậy sao Amazon vẫn chưa thực hiện? Bởi vì nếu bây giờ thực hiện mô hình đó, chi phí của việc thu thập và xử lý những món hàng bị trả lại sẽ lớn hơn sự tăng trưởng doanh thu từ phần lớn
của ví tiền khách hàng. Ví dụ, hôm nay chúng ta trả lại 95% số món hàng mà Amazon vận chuyển tới. Điều đó gây khó chịu cho chúng ta và tốn kém cho Amazon. Sự dự đoán không đủ tốt để Amazon thực hiện mô hình mới. Chúng ta có thể hình dung ra cảnh khi Amazon thực hiện chiến lược mới ngay trước cả khi độ chính xác của sự dự đoán đủ tốt để khiến Amazon sinh lợi nhuận vì công ty mong muốn ở một thời điểm nào đó sẽ sinh lợi nhuận. Bằng cách ra mắt sớm hơn, AI của Amazon sẽ nhận được nhiều dữ liệu sớm hơn và cải thiện nhanh hơn. Amazon nhận ra rằng họ bắt đầu càng sớm thì các đối thủ sẽ càng khó bắt kịp. Sự dự đoán tốt hơn sẽ thu hút nhiều người mua hàng hơn, nhiều người mua hàng sẽ tạo ra nhiều dữ liệu để đào tạo AI, nhiều dữ liệu sẽ dẫn đến sự dự đoán tốt hơn, và cứ thế tạo thành một chu kỳ vòng tròn. Thực hiện quá sớm có thể tốn kém, nhưng thực hiện quá muộn lại có thể nguy hiểm.9
Quan điểm của chúng tôi không phải là Amazon sẽ hay nên làm điều này, mặc dù những độc giả còn nghi ngờ sẽ thấy ngạc nhiên khi biết Amazon đã nhận bằng sáng chế Hoa Kỳ cho việc “dự đoán vận chuyển” vào năm 2013.10 Thay vào đó, sự thấu hiểu sâu sắc quan trọng nhất là việc dự đoán có ảnh hưởng đáng kể lên chiến lược. Trong ví dụ này, nó làm thay đổi mô hình kinh doanh của Amazon từ mua hàng-rồi-vận chuyển sang vận chuyển-rồi mua hàng, tạo ra động lực để tích hợp theo chiều dọc vào việc vận hành dịch vụ chuyển trả hàng (bao gồm hệ thống xe tải), tăng tốc thời gian đầu tư. Tất cả những điều này đơn giản là nhờ áp dụng sự dự đoán. Điều này có ý nghĩa thế nào với chiến lược? Đầu tiên, bạn phải đầu tư thu thập thông tin tập trung vào tốc độ và khoảng cách cần vặn nút trên máy dự đoán cho lĩnh vực của bạn và những ứng dụng. Thứ hai, bạn cần phải đầu tư vào việc phát triển luận đề về những lựa chọn chiến lược được tạo ra từ việc vặn nút.
Để bắt đầu bài học “khoa học viễn tưởng” này, hãy nhắm mắt lại, tưởng tượng bạn đang đặt tay lên nút vặn của máy dự đoán, và theo những câu nói bất hủ của nhóm nhạc Spinal Tap, vặn nó tới nút mười một.
Kế hoạch cho cuốn sách
Bạn cần xây dựng nền tảng trước khi những ảnh hưởng chiến lược của máy dự đoán tới tổ chức của bạn trở nên rõ ràng. Đó chính xác là cách chúng tôi cấu trúc cuốn sách này, xây dựng một kim tự tháp từ mặt đất.
Chúng tôi xây dựng nền móng ở phần một và giải thích cách máy tự học sẽ khiến sự dự đoán trở nên tốt hơn như thế nào. Chúng tôi tiếp đến lý giải vì sao những tiến bộ mới này khác với những số liệu thống kê bạn học ở trường hoặc những chuyên gia phân tích của bạn thực hiện. Sau đó chúng tôi xem xét yếu tố bổ sung quan trọng với việc dự đoán, dữ liệu, đặc biệt là những loại dữ liệu cần thiết để có được những dự đoán tốt. Cuối cùng, chúng tôi đi sâu vào việc khi nào máy dự đoán sẽ hoạt động tốt hơn con người và khi nào con người và máy móc có thể làm việc chung để sự dự đoán chính xác hơn.
Trong phần hai, chúng tôi mô tả vai trò của sự dự đoán như là thông tin đầu vào của quá trình đưa ra quyết định và lý giải tầm quan trọng của một thành phần khác mà cộng đồng AI từ trước đến nay lãng quên: sự đánh giá. Sự dự đoán giúp việc đưa ra quyết định dễ dàng hơn bằng việc giảm sự không chắc
chắn, trong khi sự đánh giá gắn giá trị cho nó.
Những vấn đề thực tiễn là trọng tâm của phần ba. Những công cụ AI khiến máy dự đoán trở nên hữu ích và là sự bổ sung của máy dự đoán được thiết kế để thực hiện một công việc cụ thể. Chúng tôi phác thảo ra ba bước có thể giúp bạn trong việc xác định khi nào xây dựng (hoặc mua) công cụ AI thì sẽ tạo ra lợi nhuận đầu tư cao nhất. Đôi khi những công cụ đó sẽ phù hợp với luồng công việc hiện có; ở một số thời điểm khác, những công cụ đó sẽ là động lực để thiết kế lại luồng công việc. Trong quá trình, chúng tôi giới thiệu công cụ trợ giúp quan trọng để cụ thể hóa những tính năng chính của công cụ AI: Canvas AI.
Chúng tôi chuyển sang nói về chiến lược ở phần thứ tư. Như chúng tôi miêu tả trong thí nghiệm Amazon, một số AI sẽ có ảnh hưởng sâu sắc đến yếu tố kinh tế của một lĩnh vực đến mức có thể thay đổi một doanh nghiệp hay một nền công nghiệp. Đó là khi AI trở thành nền tảng của chiến lược trong một tổ chức. Những AI có ảnh hưởng tới chiến lược đã khiến những nhà quản lý sản phẩm, các kỹ sư và các nhà quản lý cấp cao phải chú ý. Đôi khi thật khó để có thể nói trước khi nào một công cụ sẽ có hiệu ứng mạnh mẽ đến vậy. Ví dụ, khi sử dụng công cụ tìm kiếm của Google, một vài người đã dự đoán rằng công cụ này sẽ thay đổi ngành công nghiệp truyền thông và trở thành nền tảng của một trong những công ty có giá trị nhất trên Trái Đất.
Bên cạnh những cơ hội trên bề nổi, AI còn gây ra những lỗi hệ thống có thể ảnh hưởng đến doanh nghiệp trừ khi bạn thực hiện những hành động ngăn
chặn. Các cuộc thảo luận quan trọng dường như chỉ tập trung vào những rủi ro mà AI có thể gây ra cho nhân loại, nhưng họ ít chú ý đến những rủi ro về AI mà các tổ chức sẽ gặp phải. Ví dụ, một vài máy dự đoán được đào tạo dựa trên những dữ liệu thu thập từ con người đã “học” được những thành kiến và khuôn mẫu nguy hiểm.
Chúng tôi kết thúc cuốn sách ở phần năm bằng việc áp dụng công cụ của những chuyên gia kinh tế như chúng tôi vào những câu hỏi có tầm ảnh hưởng rộng hơn đến xã hội, xem xét năm trong số những tranh luận phổ biến về AI:
1. Liệu vẫn còn công việc? Còn.
2. Điều này sẽ gây ra sự bất bình đẳng? Có thể.
3. Sẽ có một vài công ty lớn kiểm soát mọi thứ? Phụ thuộc vào tình hình.
4. Liệu các quốc gia có tham gia vào việc hoạch định chính sách theo từng giai đoạn và liệu quyền riêng tư cũng như an ninh của chúng ta sẽ bị tước đoạt để mang lại cho những công ty trong nước lợi ích cạnh tranh tốt hơn? Một vài quốc gia sẽ làm như vậy.
5. Tận thế sắp đến rồi? Bạn vẫn còn đủ thời gian để khai thác giá trị từ cuốn sách này.
NHỮNG ĐIỂM CHÍNH
• Nền kinh tế cung cấp sự thấu hiểu rõ ràng về việc áp dụng những dự đoán giá rẻ của các doanh nghiệp. Máy dự đoán sẽ được sử dụng cho những công việc dự đoán truyền thống (hàng tồn kho và dự đoán nhu cầu) và những vấn
đề mới (như điều hướng và dịch thuật). Việc giảm chi phí dự đoán sẽ ảnh hưởng đến giá trị của những thứ khác, tăng giá trị của những sự bổ sung (dữ liệu, sự đánh giá, hành động) và giảm giá trị của những sản phẩm thay thế (sự dự đoán của con người)
• Những tổ chức có thể khai thác máy dự đoán bằng cách áp dụng những công cụ AI hỗ trợ thực hiện chiến lược hiện giờ của họ. Khi những công cụ này trở nên mạnh mẽ hơn, chúng có thể thúc đẩy việc thay đổi chiến lược. Ví dụ, nếu Amazon có thể dự đoán những người mua hàng muốn gì, họ có thể
thay đổi mô hình từ mua hàng- rồi-vận chuyển sang vận chuyển-rồi-mua hàng – mang những sản phẩm tới nhà của người dùng trước khi họ đặt hàng. Sự đặt hàng này sẽ thay đổi tổ chức.
• Do những chiến lược mới mà những tổ chức sẽ theo đuổi để tận dụng ưu thế của AI, chúng ta sẽ đối mặt với nhiều sự đánh đổi mới liên quan đến cách AI sẽ ảnh hưởng đến xã hội. Những sự lựa chọn của chúng ta sẽ phụ thuộc vào nhu cầu, sở thích và sẽ gần như khác nhau giữa những quốc gia và nền văn hoá khác nhau. Chúng tôi cấu trúc cuốn sách thành năm phần để phản ánh từng lớp tác động của AI, xây dựng từ nền tảng của sự dự đoán cho đến những sự đánh đổi của xã hội: (1) Sự dự đoán, (2) Quá trình đưa ra quyết định, (3) Những công cụ, (4) Những chiến lược và (5) Xã hội
PHẦN 1SỰ DỰ ĐOÁN
3Sự kì diệu của máy dự đoán
Đ
iểm chung giữa Harry Potter, Nàng Bạch Tuyết và Macbeth là gì? Những nhân vật này đều bị thúc đẩy bởi lời tiên tri, lời dự đoán. Từ tôn giáo đến những câu chuyện cổ tích, kiến thức về tương lai là hậu quả tất yếu. Sự dự đoán ảnh hưởng đến hành vi và những quyết định.
Những người Hy Lạp cổ đại kính trọng những nhà tiên tri của họ bởi khả năng dự đoán, đôi khi là bởi những câu đố đánh lừa người hỏi. Ví dụ, vua Croesus của Lydia khi đó xem xét một cuộc tấn công mạo hiểm vào Đế quốc Ba Tư. Nhà vua không tin tưởng vào nhà tiên tri cụ thể nào, vậy nên ông quyết định kiểm tra từng người một trước khi hỏi ý kiến về việc tấn công Ba Tư. Ông gửi sứ giả đến mỗi nhà tiên tri. Vào ngày thứ 100, mỗi sứ giả được yêu cầu hỏi những nhà tiên tri về việc mà vua Croesus đang làm khi đó. Lời tiên tri ở Delphi dự đoán chính xác nhất, nên nhà vua đã hỏi và tin tưởng lời tiên tri ở đó.1
Trong trường hợp của vua Croesus, lời dự đoán có thể là về hiện tại. Chúng ta dự đoán liệu một giao dịch thẻ tín dụng hiện tại là hợp pháp hay bất hợp pháp, liệu một khối u trong hình ảnh y tế là ác tính hay lành tính, liệu một người nhìn vào máy ảnh của iPhone là chủ sở hữu máy hay không. Cho dù động từ gốc Latin của nó (“praedicere” – có nghĩa là “làm cho biết trước”), hiểu biết của chúng ta về mặt văn hóa của sự dự đoán nhấn mạnh khả năng nhìn thấy những thông tin ẩn giấu khác, có thể là ở quá khứ, hiện tại, hay tương lai. Quả cầu pha lê có lẽ là biểu tượng quen thuộc nhất của sự dự đoán đầy ma thuật. Chúng ta thường liên tưởng quả cầu pha lê đến những người tiên tri về sự giàu có hay đường tình duyên của ai đó trong tương lai, như trong The Wizard of Oz (Phù thủy xứ Oz), điều đó dẫn dắt chúng ta tới định nghĩa của dự đoán:
DỰ ĐOÁN là quá trình điền thông tin còn thiếu. Sự dự đoán lấy những thông tin mà bạn có, thường được gọi là “dữ liệu” và sử dụng chúng để tạo ra thông tin mà bạn chưa có.
Sự kì diệu của dự đoán
Nhiều năm về trước, Avi (một trong những tác giả) nhận ra một khoản giao dịch lớn, bất thường ở casino tại Las Vegas trong thẻ tín dụng của anh. Lúc đó anh ấy không ở Las Vegas. Anh ấy tới đó một lần từ rất lâu trước đó; việc thua cá độ không có sức hút đối với anh về mặt kinh tế học. Sau một cuộc trò chuyện kĩ lưỡng, nhà cung cấp thẻ tín dụng đã thay đổi được giao dịch đó và đổi thẻ cho anh ấy.
Gần đây, một vấn đề tương tự xảy ra. Ai đó đã dùng thẻ tín dụng của Avi để mua sắm. Lần này Avi không thấy khoản đó trong bản báo cáo và không phải đối mặt với quá trình giải thích với đại diện dịch vụ khách hàng lịch sự nhưng cứng rắn. Thay vào đó, anh ấy nhận được cuộc gọi trực tiếp từ phía công ty rằng thẻ của anh ấy đã bị xâm phạm và một chiếc thẻ mới đã được gửi tới. Nhà cung cấp thẻ tín dụng đã suy luận chính xác rằng giao dịch đó là lừa đảo, dựa trên thói quen tiêu tiền của Avi và nhiều dữ liệu khác. Công ty thẻ tín dụng đã tự tin vào sự dự đoán của mình đến mức họ thậm chí không chặn thẻ của anh ấy khi họ điều tra. Thay vào đó, như một phép màu, công ty gửi thẻ thay thế đến Avi mà không cần anh ấy làm bất kỳ điều gì. Tất nhiên là nhà cung cấp thẻ tín dụng không có quả cầu pha lê. Họ có dữ liệu và mô hình dự đoán tốt: máy dự đoán. Sự dự đoán tốt hơn cho phép họ ngăn chặn sự lừa đảo, như Ajay Bhalla, giám đốc mảng rủi ro doanh nghiệp và an ninh của Mastercard nói: “giải quyết vấn đề đau đầu lớn cho khách hàng về việc thẻ bị giả mạo rút tiền.”2
Những ứng dụng của doanh nghiệp đều phù hợp với định nghĩa về sự dự đoán của chúng tôi như là một quá trình điền thông tin còn thiếu. Sự dự đoán có ích đối với mạng lưới thẻ tín dụng để nhận biết giao dịch nào gần đây là lừa đảo. Mạng lưới thẻ tín dụng sử dụng thông tin về những giao dịch lừa đảo trước đó (và cả những giao dịch bình thường) để dự đoán rằng liệu giao dịch gần đây có phải là lừa đảo hay không. Nếu đúng là vậy, nhà cung cấp thẻ tín dụng có thể ngăn chặn những giao dịch tương lai của chiếc thẻ đó và nếu sự dự đoán được thực hiện đủ nhanh chóng, thì ngay cả những giao dịch lừa đảo trong hiện tại cũng có thể được ngăn chặn.
Khái niệm – lấy vào một loại thông tin và biến nó thành một loại thông tin khác – là trung tâm của một trong những thành tựu gần đây của AI: dịch thuật
ngôn ngữ, mục tiêu đã từ rất lâu của toàn bộ nền văn minh nhân loại, thậm chí được lưu giữ trong câu chuyện của thiên niên kỷ về Tháp Babel.* Về mặt lịch sử, cách thức tiếp cận với sự dịch thuật ngôn ngữ tự động là thuê một nhà ngôn ngữ học - chuyên gia về những quy tắc ngôn ngữ - để giải thích quy tắc và dịch chúng sang loại ngôn ngữ có thể lập trình được.3 Đó là cách mà bạn có thể lấy một cụm từ tiếng Tây Ban Nha và, ngoài việc đơn giản là thay thế từ bằng từ, hiểu rằng bạn cần thay đổi thứ tự danh từ và tính từ để biến nó thành một câu có nghĩa.
* Tháp Babel là một ngọn tháp to lớn được xây dựng ở thành phố Babylon, một thành phố quốc tế điển hình bởi sự hỗn tạp giữa các ngôn ngữ.
Tuy nhiên, những tiến bộ gần đây của AI đã cho phép chúng ta định hình lại việc dịch thuật như là một vấn đề của sự dự đoán. Chúng ta có thể nhìn thấy bản chất dường như kì diệu của việc sử dụng dự đoán để dịch thuật nếu đối chiếu với sự thay đổi đột ngột về chất lượng dịch thuật của Google. Truyện
gắnThe Snows of Kilimanjaro (tạm dịch: Tuyết trên đỉnh Kilimanjaro) của Ernest Hemingway bắt đầu câu chuyện bằng hình ảnh đẹp:
Kilimanjaro là ngọn núi được bao phủ bởi tuyết cao 19.710 feet và nó được cho là ngọn núi cao nhất ở châu Phi.
Vào một ngày tháng 11 năm 2016, khi dịch bản tiếng Nhật của tập truyện ngắn kinh điển của Hemingway sang tiếng Anh nhờ Google, Giáo sư Jun Rekimoto, một nhà khoa học máy tính ở trường Đại học Tokyo đã đọc thành:
Kilimanjaro là ngọn núi cao 19.710 feet bị tuyết bao phủ và được cho là ngọn núi cao nhất ở châu Phi.
Ngày hôm sau Google dịch đã chuyển thành:
Kilimanjaro là một ngọn núi 19.710 feet được bao phủ bởi tuyết và được cho là ngọn núi cao nhất ở châu Phi.
Sự khác biệt thật đáng kinh ngạc. Chỉ qua một đêm, một bản dịch rõ ràng được dịch tự động và cứng nhắc đã trở nên vô cùng mạch lạc, từ một người có vẻ gặp khó khăn với việc dùng từ điển thành một người có vẻ như thông thạo cả hai ngôn ngữ.
Phải thừa nhận rằng, nó không thể hay bằng bản gốc của Hemingway, nhưng sự cải thiện là rất đỗi phi thường. Babel dường như đã trở lại và sự thay đổi này không phải là tình cờ hay đáng ngạc nhiên. Google đã cải thiện bộ máy đằng sau sản phẩm dịch thuật của họ để tận dụng những lợi thế gần đây của AI. Cụ thể, dịch vụ dịch thuật của Google hiện giờ phụ thuộc vào việc học sâu để dự đoán siêu nạp.
Dịch thuật từ tiếng Anh sang tiếng Nhật về cơ bản là việc dự đoán những từ và cụm từ tiếng Nhật tương thích với tiếng Anh. Thông tin còn thiếu cần được dự đoán ở đây là những cụm từ tiếng Nhật và thứ tự của chúng. Lấy vào dữ liệu từ một ngoại ngữ và dự đoán những cụm từ chính xác theo đúng thứ tự của thứ ngoại ngữ bạn biết và rồi bạn có thể hiểu được một ngôn ngữ khác. Nếu làm chính xác thì bạn có thể sẽ không nhận ra việc dịch thuật đã được thực hiện.
Các công ty đã không lãng phí thời gian của họ khi mang công nghệ kì diệu này vào sử dụng trong thương mại. Ví dụ, hơn 500 triệu người ở Trung Quốc đã sử dụng dịch vụ được ứng dụng từ việc học sâu do iFlytek phát triển để dịch thuật, phiên âm và giao tiếp bằng ngôn ngữ bản địa.
Chủ nhà sử dụng nó để giao tiếp với người thuê nhà nói ngôn ngữ khác, bệnh nhân sử dụng nó để giao tiếp với robot để chỉ dẫn, bác sĩ sử dụng nó để kê đơn chi tiết cho người bệnh và người lái xe sử dụng nó để giao tiếp với phương tiện của họ.4
AI càng được sử dụng nhiều sẽ càng thu nhập được nhiều dữ liệu, nó càng học hỏi nhiều hơn thì sẽ càng trở nên tốt hơn. Với nhiều người dùng như vậy, AI đang ngày càng tiến bộ nhanh chóng.
Sự dự đoán đã trở nên tốt hơn như thế nào so với trước đây?
Sự thay đổi trong Google Dịch đã minh hoạ cho cách máy tự học (trong đó học sâu là một nhánh) có thể giảm thiểu đáng kể chi phí của sự dự đoán với chất lượng đã thay đổi. Với chi phí tương tự khi nói về khả năng máy móc, Google giờ đã có thể cung cấp các bản dịch có chất lượng tốt hơn. Chi phí của việc sản xuất sự dự đoán với cùng chất lượng đã giảm một cách đáng kể.
Những sự đổi mới trong công nghệ dự đoán đang có ảnh hưởng lên những
lĩnh vực mà trước nay luôn gắn liền với sự dự đoán, ví dụ như phát hiện lừa đảo. Sự phát hiện lừa đảo thẻ tín dụng đã cải thiện nhiều đến mức những công ty thẻ tín dụng phát hiện và xử lý lừa đảo trước khi chúng ta nhận ra có điều gì đó không ổn. Tuy nhiên, sự cải thiện này dường như vẫn đang dần gia tăng. Vào cuối những năm 1990, những phương pháp hàng đầu nhận diện khoảng 80% số giao dịch lừa đảo.5 Tỉ lệ này tăng lên đến mức 90-95% vào năm 2000 và đến mức 98-99.9% hiện nay.6 Bước nhảy cuối cùng đó là kết quả của máy tự học; sự thay đổi từ 98% đến 99.9% mang tính thay đổi lớn.
Sự thay đổi từ 98% đến 99.9% có thể mang tính gia tăng, nhưng những thay đổi nhỏ mang ý nghĩa rất lớn nếu những sai sót là vô cùng tốn kém. Sự cải thiện độ chính xác từ 85% đến 90% đồng nghĩa với việc những sai sót giảm đến 1/3. Sự cải thiện độ chính xác từ 98% đến 99.9% đồng nghĩa với việc những sai sót xuống còn 1/20.
Việc giảm giá thành dự đoán đang thay đổi nhiều hoạt động của con người. Giống như những ứng dụng đầu tiên của máy tính được áp dụng vào những vấn đề thuật toán quen thuộc như bảng điều tra dân số và thuật phóng, nhiều
ứng dụng đầu tiên của dự đoán có giá thành rẻ từ máy tự học đang được áp dụng cho những vấn đề dự đoán kinh điển. Ngoài việc phát hiện lừa đảo, những ứng dụng còn được áp dụng trong các lĩnh vực như tín dụng, bảo hiểm y tế và quản lý hàng tồn kho. Tín dụng bao gồm việc dự đoán khả năng một ai đó có thể trả khoản vay. Bảo hiểm y tế bao gồm việc dự đoán một cá nhân sẽ chi trả bao nhiêu vào vấn đề chăm sóc sức khoẻ. Quản lý hàng tồn kho bao gồm việc dự đoán có bao nhiêu mặt hàng sẽ ở trong kho vào một ngày nhất định.
Gần đây, nhiều vấn đề dự đoán hoàn toàn mới xuất hiện. Nhiều trong số đó gần như bất khả thi nếu không có những tiến bộ gần đây trong công nghệ máy móc thông minh, bao gồm nhận diện đối tượng, dịch thuật ngôn ngữ và phát hiện ma tuý. Ví dụ, ImageNet Challenge là cuộc thi cao cấp thường niên dự đoán tên của một đối tượng trong một hình ảnh. Dự đoán đối tượng trong một hình ảnh có thể là một nhiệm vụ khó khăn, kể cả với con người. Dữ liệu của ImageNet lưu trữ hàng nghìn danh mục đối tượng, bao gồm nhiều giống chó và những hình ảnh tương tự. Để có thể phân biệt giống chó ngao Tây Tạng và giống chó núi Bern, hay giữa một két khoá an toàn và một tổ hợp khoá là rất khó. Con người có thể mắc sai sót khoảng 5%.7
Từ cuộc thi đầu tiên diễn ra vào năm 2010 cho đến cuộc thi cuối cùng vào năm 2017, khả năng dự đoán đã trở nên tốt hơn. Hình 3-1 cho thấy độ chính xác của những người chiến thắng trong cuộc thi theo từng năm. Trục dọc thể hiện tỉ lệ sai sót, vì vậy tỉ lệ càng thấp thì càng tốt. Vào năm 2010, máy dự đoán giỏi nhất mắc sai sót trong 28% số bức ảnh. Vào năm 2012, các thí sinh lần đầu tiên ứng dụng việc học sâu và tỉ lệ sai sót giảm xuống 16%. Theo đánh giá của giáo sư đồng thời là nhà khoa học máy tính Olga Russakovsky của Đại học Princeton, “2012 thực sự là năm có bước đột phá lớn trong độ chính xác, nhưng đó cũng là bằng chứng cho khái niệm của mô hình học sâu, ứng dụng đã tồn tại trong nhiều thập kỷ.”8 Sự cải thiện trong thuật toán tiếp tục diễn ra một cách nhanh chóng, và một đội đã vượt qua định mức của con người trong cuộc thi lần đầu tiên vào năm 2015. Đến năm 2017, đa số các đội trong số 38 đội đã làm tốt hơn so với định mức của con người và đội giỏi nhất đã giảm sự sai sót xuống còn một nửa. Máy móc có thể xác định những loại hình ảnh tốt hơn con người.9
Thế hệ AI hiện tại là cả một quá trình dài từ những máy móc thông minh của khoa học viễn tưởng. Sự dự đoán không mang lại cho chúng ta HAL từ 2001:A Space Odyssey, Skynet từ The Terminator (Kẻ hủy diệt), hay C3PO từ Star Wars. Nếu AI hiện nay chỉ đơn thuần là sự dự đoán, vậy thì sao nhiều người lại bàn luận về nó đến vậy? Lý do là vì sự dự đoán là thông tin đầu vào cơ bản. Bạn có thể không nhận ra nhưng sự dự đoán có mặt ở mọi nơi. Công việc kinh doanh và đời sống cá nhân của chúng ta đều đầy ắp những sự dự đoán. Thông thường sự dự đoán được ẩn dưới dạng thông tin đầu vào của quá trình đưa ra quyết định. Sự dự đoán tốt hơn đồng nghĩa với thông tin tốt hơn, cũng đồng nghĩa với quá trình đưa ra quyết định tốt hơn.
Sự dự đoán là “thông tin” để “có được thông tin hữu ích hơn”10. Máy dự đoán có thể tạo ra thông tin hữu ích một cách nhân tạo. Thông tin đóng vai trò vô cùng quan trọng. Sự dự đoán tốt hơn dẫn đến kết quả tốt hơn, như chúng tôi đã minh hoạ trong ví dụ phát hiện lừa đảo. Cùng với việc giá thành của sự dự đoán tiếp tục giảm, chúng tôi khám phá tính hữu ích của nó trong chuỗi đa dạng đáng kể của nhiều hoạt động khác, đồng thời cho phép thực hiện tất cả những việc, như dịch thuật ngôn ngữ bằng máy móc, mà trước đây không thể tưởng tượng được.
NHỮNG ĐIỂM CHÍNH
• Sự dự đoán là quá trình điền thông tin còn thiếu. Sự dự đoán cần thông tin mà bạn có, thường được gọi là “dữ liệu”, và sử dụng chúng để tạo ra thông tin mà bạn chưa có. Bên cạnh việc tạo ra thông tin về tương lai, sự dự đoán
có thể tạo ra thông tin liên quan đến hiện tại và quá khứ. Điều này xảy ra khi sự dự đoán phân loại được những giao dịch thẻ tín dụng nào là lừa đảo, khối u nào trong hình ảnh là ác tính, hay người cầm chiếc iPhone có phải chủ sở hữu máy không.
• Ảnh hưởng của những cải thiện nhỏ trong độ chính xác của sự dự đoán có thể đánh lừa chúng ta. Ví dụ, sự cải thiện từ 85% đến 90% độ chính xác dường như gấp đôi sự cải thiện từ 98% đến 99.9% (sự gia tăng của 5% so với 2%). Tuy nhiên, sự cải thiện từ 85% đến 90% đồng nghĩa với việc sai sót giảm 1/3, trong khi đó sự cải thiện từ 98% đến 90% đồng nghĩa với việc sai sót giảm xuống còn1/20. Ở một vài trường hợp, tỉ lệ sai sót 1/20 đã mang tính chất thay đổi lớn.
• Quá trình tưởng như tầm thường của việc điền thông tin thiếu có thể khiến máy dự đoán trở nên kì diệu. Điều này đã xảy ra khi máy móc có thể nhìn (nhận dạng đối tượng), điều hướng (xe không người lái) và dịch thuật.
4Vì sao lại gọi là trí tuệ?
V
ào năm 1956, một nhóm các học giả gặp nhau ở Đại học Dartmouth, New Hampshire để vạch ra con đường nghiên cứu trí tuệ nhân tạo. Họ muốn biết liệu máy tính có thể được lập trình để có suy nghĩ nhận thức trong những việc như chơi máy tính, chứng minh định lý toán học và tương tự. Họ cũng đã suy nghĩ cẩn thận về ngôn ngữ và kiến thức để máy tính có thể mô tả đồ vật. Nỗ lực của họ bao gồm những lần thử nghiệm để cho máy tính lựa chọn và để chúng lựa chọn điều tốt nhất. Những nhà nghiên cứu rất lạc quan về khả năng của AI. Khi xin tiền tài trợ từ Quỹ Rockefeller, họ viết:
Chúng tôi sẽ nỗ lực để tìm hiểu cách khiến máy móc sử dụng ngôn ngữ, tạo ra các hình ảnh trừu tượng và khái niệm, giải quyết những vấn đề của con người, và có khả năng tự cải thiện bản thân. Chúng tôi nghĩ rằng một sự tiến bộ kinh ngạc có thể được tạo ra từ một hoặc nhiều hơn từ những vấn đề này nếu một nhóm các nhà khoa học được tuyển chọn kĩ lưỡng cùng nhau nghiên cứu về vấn đề này trong mùa hè.1
Chương trình nghị sự này cuối cùng đã trở thành viển vông hơn là thực tế. Trong số những thử thách khác, máy tính của những năm 1950 không đủ nhanh để có thể làm những gì các học giả hình dung.
Sau tuyên bố nghiên cứu ban đầu đó, AI cho thấy những bước tiến đầu trong việc dịch thuật, nhưng vẫn còn khá chậm. Làm việc với AI trong những môi trường cụ thể (ví dụ, một AI hoạt động như một nhà trị liệu nhân tạo) thất bại trong việc khái quát. Đầu những năm 1980 đã mang lại hy vọng rằng các kỹ
sư có thể cẩn thận lập trình những hệ thống chuyên gia để nhân rộng những lĩnh vực cần tay nghề cao như chẩn đoán y khoa, nhưng những hệ thống đó rất tốn kém để phát triển, cồng kềnh và không thể giải quyết vô số những ngoại lệ và khả năng, dẫn đến khái niệm mà thường được biết đến là “mùa đông AI”.
Tuy nhiên, mùa đông cũng nhanh kết thúc.
Càng nhiều dữ liệu, mô hình càng tốt và máy tính với nhiều tính năng đã
khiến những sự phát triển gần đây trong máy tự học nâng cao sự dự đoán khả thi. Sự cải thiện trong thu nhập và lưu trữ dữ liệu khổng lồ đã cung cấp nguyên liệu cho những thuật toán học máy mới. So với những mô hình thống kê cũ, và được tạo điều kiện bởi sự phát minh của những bộ vi xử lý phù hợp hơn, những mô hình máy tự học mới đã trở nên linh hoạt đáng kể và tạo ra sự dự đoán tốt hơn – tốt đến mức một vài người đã một lần nữa miêu tả ngành khoa học máy tính này là “trí tuệ nhân tạo”.
Dự đoán tỉ lệ Churn
Dữ liệu, mô hình và máy tính tốt hơn là cốt lõi của sự tiến bộ trong dự đoán. Để có thể hiểu giá trị của chúng, hãy cùng xem xét một vấn đề đã xuất hiện từ lâu của sự dự đoán: dự đoán điều mà những người làm marketing gọi là “tỉ lệ khách hàng không hài lòng”. Với nhiều doanh nghiệp, thu hút khách hàng là một việc rất tốn kém và, do đó, mất khách hàng qua tỉ lệ churn là rất đắt đỏ. Một khi đã có được khách hàng, các doanh nghiệp có thể tận dụng những chi phí thu mua đó bằng việc giảm tỉ lệ churn. Trong những ngành công nghiệp dịch vụ như bảo hiểm, dịch vụ tài chính và viễn thông, quản lý tỉ lệ churn có lẽ là hoạt động marketing quan trọng nhất. Bước đầu tiên trong việc giảm tỉ lệ churn là xác định những khách hàng có khả năng đem lại rủi ro này. Các công ty có thể sử dụng công nghệ dự đoán để làm điều này.
Trong lịch sử, phương pháp cốt lõi để dự đoán tỉ lệ churn là một kỹ thuật số liệu gọi “sự hồi quy”. Nghiên cứu tập trung vào cải thiện những kỹ thuật hồi quy này. Những nhà nghiên cứu đã đề xuất và thử nghiệm hàng trăm phương pháp hồi quy khác nhau trong các tạp chí học thuật và trong thực tế. Sự hồi quy có thể làm gì? Nó tìm kiếm sự dự đoán dựa trên mức trung bình của những gì xảy ra trong quá khứ. Ví dụ, nếu bạn phải xác định xem ngày mai có mưa hay không căn cứ vào tỉ lệ mưa từng ngày của tuần trước, dự đoán tốt nhất bạn có thể đưa ra sẽ chỉ ở mức trung bình. Nếu trời mưa vào hai trong số bảy ngày vừa qua, bạn có thể dự đoán rằng khả năng trời mưa ngày mai là 2/7, hay 29%. Phần lớn những gì chúng ta biết về sự dự đoán đã giúp cho những sự tính toán mức trung bình của chúng ta trở nên tốt hơn bằng cách xây dựng những mô hình có thể nhận vào nhiều dữ liệu về bối cảnh.
Chúng ta đã làm được điều này bằng việc sử dụng một thứ gọi là “mức trung bình có điều kiện”. Ví dụ, nếu bạn sống ở phía Bắc California, bạn có thể có những hiểu biết nhất định trong quá khứ rằng khả năng mưa ở đây phụ thuộc
vào mùa – khả năng thấp vào mùa hè và cao vào mùa đông. Nếu bạn quan sát thấy rằng trong mùa đông, khả năng mưa của một ngày bất kỳ là 25%, thì trong mùa hè, khả năng chỉ là 5%, bạn sẽ không dự đoán rằng khả năng mưa ngày mai là ở mức trung bình – 15%. Vì sao? Vì bạn biết rằng mai là ngày mùa đông hay mùa hè, nên bạn có điều kiện để dựa vào đó và đưa ra sự đánh giá tương ứng.
Thay đổi theo mùa chỉ là một cách mà chúng ta đánh giá mức trung bình có điều kiện (cho dù đó là cách phổ biến trong thương mại bán lẻ). Chúng ta đánh giá mức trung bình có điều kiện dựa trên thời gian trong ngày, mức ô nhiễm, độ che phủ của mây, nhiệt độ đại dương, hay bất kỳ thông tin nào có sẵn.
Hoàn toàn có thể đánh giá điều kiện dựa vào nhiều yếu tố đồng thời. Liệu mai có mưa không nếu hôm nay đã mưa, trời đang vào mùa đông, trời mưa ở 200 dặm về phía Tây, trời nắng ở 100 dặm về phía Nam, mặt đất ẩm ướt, nhiệt độ
Bắc Băng Dương thấp và gió thổi từ phía Tây Nam ở mức 15 dặm một giờ? Tuy nhiên, nó có thể nhanh chóng trở nên khá khó sử dụng. Riêng việc tính toán mức trung bình cho bảy loại thông tin này đã tạo ra 128 tổ hợp khác nhau. Thêm những loại thông tin khác vào sẽ tạo ra nhiều tổ hợp hơn theo cấp số nhân.
Trước khi có máy tự học, sự hồi quy đa biến đã cung cấp một cách hiệu quả để đánh giá điều kiện dựa vào nhiều yếu tố, mà không cần phải tính toán hàng chục, hàng trăm hoặc hàng nghìn mức trung bình có điều kiện. Sự hồi quy nhận dữ liệu và cố gắng tìm kiếm kết quả đồng thời hạn chế sai sót dự đoán, tối đa hoá thứ được gọi là “sự phù hợp (của mô hình hồi quy)”.
Thật may rằng thuật ngữ này chính xác về mặt toán học hơn về về mặt ngôn ngữ. Sự hồi quy giảm thiểu tối đa sai sót dự đoán ở mức trung bình và sửa lại những sai sót lớn nhiều hơn sai sót nhỏ. Đó là một phương pháp hiệu quả, đặc biệt là với những bộ dữ liệu khá nhỏ và ý thức tốt về những gì sẽ có ích trong việc dự đoán. Với tỉ lệ churn trong truyền hình cáp, nó có thể phản ánh độ thường xuyên xem TV của con người; nếu họ không sử dụng dịch vụ truyền hình cáp, vậy họ có khả năng ngừng đăng ký.
Bên cạnh đó, các mô hình hồi quy mong muốn tạo ra những kết quả không thiên vị, vậy nên với đủ những dự đoán, những dự đoán đó có thể sẽ chính
xác ở mức trung bình. Mặc dù chúng tôi thích những dự đoán không thiên vị hơn là có thiên vị (ví dụ: tự động đánh giá cao hoặc đánh giá thấp một giá trị), nhưng những dự đoán không thiên vị vẫn chưa thực sự hoàn hảo.
Việc dự đoán chính xác ở mức trung bình có thể gây ra sai sót. Sự hồi quy có thể bị lỡ mất vài feet về phía bên trái hoặc vài feet về phía bên phải. Ngay cả khi mức trung bình trùng với đáp án đúng, sự hồi quy có thể nghĩa là không bao giờ thực sự bắn trúng mục tiêu. Không giống như sự hồi quy, sự dự đoán của máy tự học có thể sai sót ở mức trung bình, nhưng khi sự dự đoán sai, chúng thường không sai quá nhiều. Những nhà thống kê mô tả điều này giống như là sự cho phép một số thiên vị để giảm phương sai.
Sự khác biệt quan trọng giữa máy tự học và phân tích hồi quy là ở cách thức các kỹ thuật mới được phát triển. Phát minh một phương pháp máy tự học mới bao gồm việc chứng minh rằng nó hoạt động tốt hơn trong thực tế. Ngược lại, phát minh một phương pháp hồi quy mới yêu cầu phải chứng minh nó hoạt động theo lý thuyết đầu tiên. Việc tập trung vào hoạt động trong thực tế giúp những nhà sáng chế máy tự học có không gian để thử nghiệm, ngay cả khi phương pháp của họ tạo ra những ước tính chính xác ở mức trung bình hoặc mang tính thiên vị. Sự tự do trong thực nghiệm này đã thúc đẩy nhanh chóng sự phát triển bằng cách tận dụng sự phong phú dữ liệu và máy tính xử lý nhanh.
Trong suốt cuối những năm 1990 và đầu những năm 2000, những thí nghiệm với máy tự học để dự đoán tỉ lệ churn của khách hàng đã có những thành công nhất định. Những phương pháp của máy tự học đang được cải thiện, nhưng sự hồi quy nhìn chung vẫn hoạt động tốt hơn. Dữ liệu không đủ phong phú và máy tính không đủ tốt để tận dụng lợi thế mà máy tự học có thể làm. Ví dụ, Trung tâm Teradata của Đại học Duke đã tổ chức giải đấu khoa học dữ liệu vào năm 2004 để dự đoán tỉ lệ churn. Những giải đấu như vậy khi đó không phổ biến. Ai cũng có thể dự thi và những bài dự thi chiến thắng sẽ nhận được giải thưởng tiền mặt. Những bài dự thi chiến thắng sử dụng mô hình hồi quy. Một vài phương pháp máy tự học đã được thể hiện một cách tương đối tốt, nhưng những phương pháp mạng lưới nơ-ron mà sau này sẽ thúc đẩy cách mạng AI đã không thể hiện tốt. Cho đến năm 2016, mọi thứ đã thay đổi. Những mô hình tỉ lệ churn tốt nhất sử dụng máy tự học và những mô hình học sâu (mạng lưới nơ-ron) nhìn chung thể hiện vượt trội hơn những
mô hình khác.
Điều gì đã thay đổi? Đầu tiên, dữ liệu và máy tính cuối cùng đã đủ tốt để cho phép máy tự học chiếm ưu thế. Vào những năm 1990, thật khó để có thể xây dựng bộ dữ liệu đủ lớn. Ví dụ, một nghiên cứu kinh điển về dự đoán tỉ lệ churn sử dụng 650 khách hàng và ít hơn 30 biến. Cho đến năm 2004, bộ xử lý và lưu trữ máy tính đã được cải thiện. Trong giải đấu Duke, tập dữ liệu đào tạo lưu trữ thông tin của hàng trăm biến cho hàng chục nghìn khách hàng. Với những biến và khách hàng được bổ sung thêm này, những phương pháp máy tự học bắt đầu được thực hiện, thậm chí là tốt hơn hồi quy.
Hiện giờ những nhà nghiên cứu dự đoán tỉ lệ churn dựa vào hàng nghìn biến và hàng triệu khách hàng. Sự cải thiện trong sức mạnh máy tính đồng nghĩa với việc có thể sử dụng lượng lớn dữ liệu, bao gồm văn bản, hình ảnh và những con số. Ví dụ, trong mô hình tỉ lệ churn ở điện thoại, những nhà nghiên cứu tận dụng dữ liệu của những cuộc gọi từng giờ bên cạnh những biến tiêu chuẩn như kích thước hoá đơn và thanh toán đúng hạn.
Những phương pháp máy tự học cũng trở nên tốt hơn ở việc tận dụng những dữ liệu có sẵn. Trong cuộc thi Duke, yếu tố quan trọng của thành công là lựa chọn trong số hàng trăm biến có sẵn và lựa chọn mô hình thống kê nào để sử dụng. Các phương pháp tốt nhất ở thời điểm đó, cho dù là máy tự học hay sự hồi quy kinh điển, đều sử dụng sự kết hợp của trực giác và những bài kiểm
tra thống kê để lựa chọn các biến và mô hình. Hiện giờ, những phương pháp máy tự học, và đặc biệt là những phương pháp học sâu, đều cho phép tính linh hoạt trong mô hình và điều này có nghĩa là các biến có thể kết hợp với nhau theo những cách bất ngờ. Những tổ hợp đó rất khó để dự đoán, nhưng chúng có thể hỗ trợ sự dự đoán rất nhiều. Bởi vì chúng rất khó để có thể đoán trước, những người lập mô hình sẽ không sử dụng chúng khi dự đoán với những kỹ thuật hồi quy tiêu chuẩn. Máy tự học đưa ra những lựa chọn mà sự kết hợp và tương tác có thể quan trọng đối với máy móc, chứ không phải với lập trình viên.
Sự cải thiện trong phương pháp máy tự học nói chung và học sâu nói riêng, có nghĩa rằng khả năng biến những dữ liệu có sẵn thành những dự đoán tỉ lệ churn chính xác là hoàn toàn có thể. Và những phương pháp máy tự học hiện giờ rõ ràng đã chiếm ưu thế hơn so với sự hồi quy và những kỹ thuật khác.
Vượt xa hơn tỉ lệ churn
Máy tự học đang cải thiện sự dự đoán trong vô số những bối cảnh khác ngoài tỉ lệ churn, từ thị trường tài chính đến thời tiết.
Cuộc khủng hoảng tài chính vào năm 2008 là một thất bại đáng kinh ngạc của những phương pháp dự đoán dựa trên sự hồi quy. Một yếu tố thúc đẩy khủng hoảng tài chính là những dự đoán về khả năng mặc định của những nghĩa vụ nợ thế chấp, hay được gọi là CDO. Vào năm 2007, những công ty xếp hạng như Standard & Poor’s dự đoán rằng những CDO hạng AAA có ít hơn 1/800 cơ hội bị thất bại trong việc không đạt được lợi nhuận trong vòng năm năm. Năm năm sau, hơn một trong bốn CDO thất bại trong việc đạt được lợi nhuận. Dự đoán ban đầu hoàn toàn sai cho dù đã có rất nhiều dữ liệu mặc định trước đây.
Sự thất bại không phải do thiếu dữ liệu, mà thay vào đó là cách những chuyên gia phân tích sử dụng dữ liệu để dự đoán. Những công ty xếp hạng dự đoán dựa trên những mô hình hồi quy giả định rằng giá nhà trong những thị trường khác nhau thì thường không liên quan đến nhau. Điều đó hoá ra là sai, không chỉ vào năm 2007 và cả trước đó cũng vậy. Bao gồm cả khả năng một cú sốc có thể gây ảnh hưởng nhiều thị trường nhà cùng một lúc và khả năng này gia tăng khi bạn mất CDO, ngay cả khi chúng được phân phối khắp nhiều thành phố của Hoa Kỳ.
Những chuyên gia phân tích xây dựng mô hình hồi quy của họ trên những giả thuyết về những điều họ tin là quan trọng và niềm tin là không cần thiết với máy tự học. Những mô hình máy tự học đặc biệt tốt trong việc xác định những biến nào có thể hoạt động tốt nhất và nhận ra một vài điều không quan trọng trong khi đó những điều khác lại quan trọng một cách đáng ngạc nhiên. Hiện giờ, trực giác và giả thuyết của chuyên gia phân tích trở nên ít quan trọng hơn. Bằng cách này, máy tự học dự đoán dựa trên những mối liên quan có thể không được dự đoán trước, bao gồm giá nhà ở Las Vegas, Phoenix và Miami có thể thay đổi cùng một lúc.
Nếu nó chỉ là sự dự đoán, thì sao lại gọi là “trí tuệ”?
Những tiến bộ gần đây trong máy tự học đã thay đổi cách chúng ta sử dụng số liệu thống kê để dự đoán. Thật hấp dẫn khi xem những phát triển gần đây
nhất trong AI và máy tự học như là “số liệu thống kê truyền thống được tiêm steroid*”. Theo một cách nào đó thì điều đó là sự thật, bởi vì mục tiêu cuối cùng là tạo ra một sự dự đoán để điền thông tin còn thiếu. Hơn nữa, quá trình máy tự học bao gồm sự tìm kiếm giải pháp có xu hướng làm giảm thiểu sai sót.
* Steroid là thuốc tăng cơ bắp, có ảnh hưởng rất lớn tới quá trình hóa học của cơ thể, kích thích tăng trưởng và các chức năng sinh lý khác.
Vậy điều gì khiến máy tự học trở thành một công nghệ máy tính mang tính chuyển đổi xứng đáng với cái tên “trí tuệ nhân tạo”? Trong một số trường hợp, sự dự đoán tốt đến mức chúng ta có thể dùng sự dự đoán thay cho logic dựa trên quy tắc.
Sự dự đoán hiệu quả thay đổi cách máy tính được lập trình. Những phương pháp thống kê truyền thống hay thuật toán của mệnh đề nếu-thì đều không hoạt động tốt trong những môi trường phức tạp. Bạn muốn nhận diện một con mèo trong nhóm những bức ảnh? Cụ thể là những chú mèo đều có nhiều màu sắc và tư thế khác nhau. Chúng có thể đứng, ngồi, nằm, nhảy nhót, hoặc trông cau có. Chúng có thể ở trong hay ở ngoài. Điều này sẽ nhanh chóng trở nên phức tạp. Do đó, ngay cả khi thực hiện một công việc dễ dàng cũng đều đòi hỏi sự cẩn thận và đó chỉ là ví dụ với những chú mèo. Vậy nếu chúng ta muốn một cách miêu tả tất cả những đối tượng trong một bức ảnh thì sao? Chúng ta cần phải miêu tả riêng từng đối tượng.
Một công nghệ quan trọng, nền tảng cho những tiến bộ gần đây, được gọi là “học sâu”, dựa vào cách tiếp cận gọi là “tuyên truyền ngược”. Nó tránh được tất cả những điều phức tạp ở trên, giống như não bộ con người, bằng cách học hỏi qua những ví dụ (liệu những nơ-ron nhân tạo bắt chước những nơ-ron thật hay không là một sự phân tâm thú vị khỏi tính ứng dụng của loại công nghệ này).
Nếu bạn muốn một đứa trẻ biết từ “con mèo”, thì mỗi khi bạn thấy con mèo, hãy nói từ này. Điều đó cũng tương tự với máy tự học. Bạn cho nó một số bức ảnh của mèo với nhãn dán “mèo” và một số bức ảnh không có mèo mà không có nhãn dán “mèo”. Máy sẽ học cách nhận diện những mẫu pixel liên quan đến nhãn dán “mèo”. Nếu bạn có những hình ảnh về cả mèo và chó thì
mối liên hệ giữa mèo và đối tượng bốn chân sẽ được củng cố. Không cần phải cụ thể hoá hơn, một khi bạn cho máy vô số triệu hình ảnh với nhiều biến khác nhau (bao gồm những hình ảnh không có chó) và dán nhãn vào máy, nó sẽ phát triển nhiều hơn những mối liên hệ và học hỏi để phân biệt giữa mèo và chó. Nhiều vấn đề đã chuyển từ vấn đề thuật toán (“con mèo có những đặc điểm gì?”) sang vấn đề dự đoán (“liệu hình ảnh không có nhãn dán này có đặc điểm giống với những con mèo mà tôi đã thấy trước đây?”). Máy tự học sử dụng những mô hình xác suất để giải quyết vấn đề.
Vậy tại sao nhiều chuyên gia công nghệ gọi máy tự học là “trí tuệ nhân tạo”? Bởi vì thông tin đầu ra của máy tự học – sự dự đoán – là thành phần quan trọng của trí tuệ, độ chính xác của sự dự đoán cải thiện qua sự học hỏi, và độ chính xác cao của sự dự đoán cho phép máy thực hiện những công việc mà cho đến giờ, thường gắn liền với trí tuệ con người, ví dụ như nhận diện đối tượng.
Trong cuốn sách On Intelligence (tạm dịch: Bàn về trí tuệ), Jeff Hawkins là một trong những người đầu tiên cho rằng sự dự đoán là cơ sở cho trí tuệ con người. Bản chất lý thuyết của ông là trí tuệ con người, cốt lõi của sự sáng tạo và gia tăng năng suất, là do cách não bộ của chúng ta sử dụng ký ức để đưa ra sự dự đoán: “Chúng ta đang liên tục đưa ra những sự dự đoán song song ở mức độ thấp trong khắp các giác quan. Nhưng đó không phải là tất cả. Tôi cho rằng nó có một vai trò mạnh mẽ hơn nhiều. Sự dự đoán không chỉ là một trong số những điều mà não bộ bạn thực hiện. Đó là chức năng chính của tân vỏ não và là nền tảng của trí tuệ. Vỏ não chính là cơ quan dự đoán.”2
Tác phẩm của Hawkins gây ra khá nhiều tranh cãi. Những ý tưởng của ông được tranh luận trong các tài liệu về tâm lý học và nhiều nhà khoa học máy tính bác bỏ sự nhấn mạnh của ông về việc vỏ não là mô hình cho máy dự đoán. Ý kiến rằng AI có thể vượt qua bài kiểm tra Turing (máy móc có khả năng đánh lừa con người tin rằng cỗ máy đó thực sự là con người) vẫn còn khá xa với thực tế. Thuật toán AI hiện tại không thể lý giải, và hơn nữa rất khó chất vấn chúng để hiểu rõ nguồn gốc sự dự đoán của chúng.
Không có sự phân biệt liệu mô hình nền tảng đó có phù hợp hay không, sự nhấn mạnh của Hawkins rằng sự dự đoán là nền tảng của trí tuệ thực sự hữu ích cho việc hiểu rõ về ảnh hưởng của những thay đổi gần đây trong AI. Ở
đây chúng tôi nhấn mạnh đến hệ quả của những cải thiện đáng kể trong công nghệ dự đoán. Rất nhiều nguyện vọng của các học giả tại hội nghị Dartmouth năm 1956 nay đã trong tầm với. Theo nhiều cách khác nhau, máy dự đoán có
thể “sử dụng ngôn ngữ, tạo ra các hình ảnh trừu tượng và khái niệm, giải quyết những vấn đề mà hiện giờ [lúc bấy giờ là năm 1955] chỉ có con người thực hiện được và tự cải thiện bản thân.”3
Chúng tôi không suy đoán liệu quá trình này có dự đoán trước sự xuất hiện của trí tuệ nhân loại, “điểm dị biệt”, hay Skynet. Tuy nhiên, như bạn sẽ thấy, sự tập trung vào sự dự đoán vẫn sẽ gợi ý những thay đổi phi thường trong vài năm tới. Giống như cách các thuật toán trở nên rẻ hơn nhờ máy tính đã chứng minh hiệu quả mạnh mẽ bằng việc đem đến những thay đổi đáng kể trong kinh doanh và đời sống cá nhân, những sự thay đổi tương tự sẽ xảy ra nhờ có sự dự đoán có giá thành rẻ.
Nhìn chung, cho dù nó là trí tuệ hay không, sự phát triển từ lập trình máy tính quyết định đến xác suất là một bước chuyển tiếp chức năng quan trọng, phù hợp với quá trình phát triển của khoa học xã hội và vật chất. Nhà triết học Ian Hacking, trong cuốn sách The Taming of Chance (tạm dịch: Làm chủ cơ hội), nói rằng, trước thế kỷ 19, xác suất chính là lãnh thổ của những người đánh cược.4 Cho đến thế kỷ 19, dữ liệu điều tra dân số đã tăng lên nhờ sử dụng kỹ thuật toán học mới xuất hiện là xác suất vào khoa học xã hội. Thế kỷ 20 chứng kiến sự sắp xếp lại hiểu biết mang tính quan trọng của chúng ta về thế giới vật chất, chuyển từ Thuyết quyết định của Newton (tất cả các sự việc xảy ra là do những điều tất yếu và do đó không thể tránh được) sang Nguyên lý bất định của cơ học lượng từ. tiến bộ quan trọng nhất trong khoa học máy tính của thế kỷ 21 phù hợp với những tiến bộ về khoa học xã hội và vật chất sau: sự công nhận rằng thuật toán hoạt động tốt nhất khi xác suất được cấu trúc dựa trên dữ liệu.
NHỮNG ĐIỂM CHÍNH
• Khoa học về máy tự học có những mục tiêu khác so với thống kê số liệu. Trong khi thống kê số liệu nhấn mạnh vào việc chính xác ở mức trung bình, máy tự học không cần điều đó. Thay vào đó, mục tiêu của máy tự học là hoạt động hiệu quả. Sự dự đoán vẫn sẽ được ưu tiên miễn là chúng tốt hơn (điều trở nên khả thi nhờ sức mạnh của máy tính). Điều này đem lại cho những nhà
khoa học sự tự do để thực nghiệm và thúc đẩy sự cải thiện nhanh chóng bằng cách tận dụng lợi thế của dữ liệu phong phú và sự xuất hiện của máy tính nhanh trong hơn một thập kỷ qua.
• Những phương pháp thống kê số liệu truyền thống yêu cầu sự chính xác của giả thuyết hoặc ít nhất là trực giác của con người đối với mô hình cụ thể. Máy tự học có ít nhu cầu xác định cái gì sẽ đi vào mô hình và có thể chứa lượng tương đương những mô hình phức tạp hơn với những tương tác giữa các biến.
• Những tiến bộ gần đây trong máy tự học thường được gọi là những tiến bộ trong trí tuệ nhân tạo vì: (1) những hệ thống dự đoán dựa trên kỹ thuật này học hỏi và cải thiện theo thời gian; (2) những hệ thống này tạo ra những dự đoán quan trọng chính xác hơn những cách tiếp cận khác dưới những điều kiện cụ thể, và một vài chuyên gia cho rằng sự dự đoán là trung tâm của trí tuệ; và (3) độ chính xác cao trong dự đoán của những hệ thống này cho phép chúng thực hiện những công việc, ví dụ như dịch thuật và điều hướng, mà trước đây thường được cho là lĩnh vực độc quyền của trí tuệ con người. Kết luận của chúng tôi không dựa trên ý kiến cá nhân về việc liệu những tiến bộ trong sự dự đoán có đại diện cho những tiến bộ về trí tuệ hay không. Chúng tôi tập trung vào hệ quả của sự giảm giá thành của sự dự đoán, không phải sự giảm giá thành của trí tuệ.
5Dữ liệu là nguyên liệu mới
H
al Varian, chuyên gia kinh tế trưởng tại Google, nói vào năm 2013, “Vào một tỷ giờ trước, con người hiện đại bắt đầu xuất hiện. Vào một tỷ phút trước, Cơ Đốc giáo bắt đầu. Vào một tỷ giây trước, máy tính IBM được phát hành. Một tỷ kết quả tìm kiếm trên Google… xảy ra trong sáng nay.”1
Google không phải là công ty duy nhất có lượng dữ liệu khổng lồ. Từ những công ty lớn như Facebook và Microsoft đến chính quyền địa phương và những công ty khởi nghiệp, việc thu nhập dữ liệu đã trở nên rẻ hơn và dễ dàng hơn bao giờ hết. Dữ liệu này đều có giá trị. Hàng tỷ kết quả tìm kiếm đồng nghĩa với việc Google có thể cải thiện dịch vụ của họ với hàng tỷ dòng dữ liệu. Một số người gọi loại dữ liệu này là “nguồn nguyên liệu mới”.
Máy dự đoán dựa vào dữ liệu. Càng nhiều dữ liệu tốt dẫn đến những kết quả dự đoán tốt hơn. Về mặt kinh tế, dữ liệu là một sự bổ sung quan trọng cho sự dự đoán. Nó trở nên có giá trị khi sự dự đoán có giá thành rẻ hơn.
Với AI, dữ liệu đóng ba vai trò. Đầu tiên là dữ liệu đầu vào, dữ liệu này được cấp cho thuật toán và sử dụng để tạo ra sự dự đoán. Thứ hai là dữ liệu đào tạo, được dùng để tạo ra thuật toán đầu tiên. Dữ liệu đào tạo được sử dụng để đào tạo AI trở nên đủ tốt để dự đoán. Cuối cùng là dữ liệu phản hồi, được dùng để cải thiện hiệu suất của thuật toán bằng kinh nghiệm. Trong một số trường hợp, nhiều sự chồng chéo xuất hiện mà ở đó những dữ liệu đóng cả ba vai trò.
Nhưng để thu được dữ liệu có thể rất tốn kém. Bởi vậy, khoản đầu tư bao gồm sự đánh đổi giữa lợi ích của việc có nhiều dữ liệu hơn và chi phí để có được nó. Để đưa ra những quyết định đầu tư dữ liệu đúng đắn, bạn phải hiểu cách mà máy dự đoán sử dụng dữ liệu.
Sự dự đoán yêu cầu dữ liệu
Trước khi có nhiều sự quan tâm đối với AI, đã từng có nhiều người hứng thú với dữ liệu lớn. Sự đa dạng, số lượng và chất lượng của dữ liệu đã tăng đáng
kể trong vòng 20 năm qua. Hình ảnh và văn bản hiện giờ ở dạng kỹ thuật số, vậy nên máy móc có thể phân tích được chúng. Máy cảm biến có mặt ở khắp mọi nơi. Sự quan tâm được đánh giá dựa trên khả năng của dữ liệu trong việc
giúp con người giảm thiểu sự không chắc chắn và hiểu thêm về những gì đang xảy ra.
Hãy cân nhắc những máy cảm biến đã được cải tiến có khả năng theo dõi nhịp tim của con người. Rất nhiều công ty và tổ chức phi lợi nhuận với những cái tên nghe có vẻ liên quan đến y tế như AliveCor và Cardiio đang xây dựng những sản phẩm sử dụng dữ liệu nhịp tim. Ví dụ, công ty khởi nghiệp Cardiogram cung cấp một ứng dụng iPhone sử dụng dữ liệu nhịp tim từ Apple Watch để tạo ra khối lượng thông tin lớn: thước đo nhịp tim theo từng giây cho tất cả những ai sử dụng ứng dụng. Người dùng có thể nhìn thấy khi nào nhịp tim của họ tăng đột biến trong ngày hoặc nhịp tim của họ tăng hay giảm trong suốt một năm, thậm chí trong suốt một thập kỷ.
Nhưng sức mạnh tiềm năng của những sản phẩm như vậy xuất phát từ sự kết hợp của dữ liệu phong phú với máy dự đoán. Cả những nhà nghiên cứu học thuật và những nhà nghiên cứu ngành công nghiệp đều đã chỉ ra rằng điện thoại thông minh có thể dự đoán những nhịp tim bất thường (nói theo thuật ngữ y khoa, sự rung tâm nhĩ).2 Vậy, với máy dự đoán, những sản phẩm mà Cardiogram, AliveCor, Cardiio và những công ty khác đang xây dựng, đều sử dụng dữ liệu nhịp tim để giúp chẩn đoán bệnh tim. Cách tiếp cận chung là sử dụng dữ liệu nhịp tim để dự đoán những thông tin chưa biết về liệu người dùng có nhịp tim bất thường hay không.
Dữ liệu đầu vào này là cần thiết để vận hành máy dự đoán. Do máy dự đoán không thể chạy mà không có dữ liệu đầu vào, trái ngược với dữ liệu đào tạo và dữ liệu phản hồi. Người dùng chưa có kinh nghiệm không thể nhìn thấy mối liên hệ giữa dữ liệu nhịp tim và nhịp tim bất thường từ dữ liệu thô. Ngược lại, Cardiogram có thể phát hiện nhịp tim bất thường với 97% độ chính xác bằng việc sử dụng hệ thống mạng nơ-ron sâu của họ.3
Những sự bất thường như vậy gây ra khoảng 1/4 khả năng đột quỵ. Với sự dự đoán tốt hơn, các bác sĩ có thể điều trị tốt hơn. Một số loại thuốc nhất định có thể ngăn ngừa đột quỵ. Để có thể làm được như vậy, cá nhân những người dùng cần phải cung cấp dữ liệu nhịp tim của họ. Nếu không có dữ liệu cá
nhân, máy không thể dự đoán được rủi ro cho người đó. Sự kết hợp của máy dự đoán với dữ liệu cá nhân của người dùng giúp dự đoán tốt hơn về khả năng của một người có nhịp tim bất thường.
Cách máy học hỏi từ dữ liệu
Thế hệ công nghệ AI hiện nay được gọi là “máy tự học” cũng có lý do. Máy móc học hỏi từ dữ liệu. Trong trường hợp của máy đo nhịp tim, để có thể dự đoán nhịp tim bất thường (và khả năng của việc đột quỵ) từ dữ liệu nhịp tim, máy dự đoán phải học mối liên hệ giữa dữ liệu với tỷ lệ thực tế của nhịp tim bất thường. Để có thể làm được vậy, máy dự đoán cần kết hợp dữ liệu đầu
vào từ Apple Watch – điều mà những nhà thống kê gọi là “biến độc lập” – với thông tin về nhịp tim bất thường (“biến phụ thuộc”).
Để máy dự đoán có thể học được, thông tin về nhịp tim bất thường phải đến từ cùng một người với dữ liệu nhịp tim được thu thập bởi Apple Watch. Vậy nên máy dự đoán cần dữ liệu từ nhiều người có nhịp tim bất thường, cùng với dữ liệu nhịp tim sẵn có của họ. Quan trọng là nó cũng cần dữ liệu từ những người không có nhịp tim bất thường cùng với dữ liệu nhịp tim của những người đó. Máy dự đoán sau đó sẽ so sánh những mẫu nhịp tim với nhịp điệu bình thường và bất thường. Sự so sánh này sẽ dẫn đến sự dự đoán. Nếu mẫu dữ liệu nhịp tim mới giống với mẫu “đào tạo” của những người có nhịp tim bất thường hơn là với mẫu của những người có nhịp tim bình thường, thì máy sẽ dự đoán rằng bệnh nhân này có nhịp tim bất thường.
Giống như nhiều ứng dụng y khoa khác, Cardiogram thu thập dữ liệu bằng cách làm việc với nhiều nhà nghiên cứu học thuật đã theo dõi 6.000 người dùng để hỗ trợ việc nghiên cứu. Trong số 6.000 người dùng, khoảng 200 người đã được chẩn đoán với nhịp tim bất thường. Vậy tất cả những gì Cardiogram làm là thu nhập dữ liệu về các mẫu nhịp tim từ Apple Watch và so sánh.
Những sản phẩm như vậy sẽ tiếp tục cải thiện độ chính xác của sự dự đoán ngay cả sau khi được phát hành. Máy dự đoán cần dữ liệu phản hồi xem liệu sự dự đoán của nó có chính xác hay không. Vậy nên, nó cần dữ liệu về tỷ lệ của nhịp tim bất thường trong số những người dùng. Máy sẽ kết hợp dữ liệu nhịp tim bất thường với dữ liệu đầu vào về việc theo dõi tim mạch để cung cấp phản hồi và liên tục cải thiện độ chính xác của sự dự đoán.
Tuy nhiên, sự thu thập dữ liệu đào tạo có thể sẽ là một thách thức. Để dự đoán những đối tượng trong cùng một nhóm (trong trường hợp này, bệnh nhân mắc bệnh tim), bạn cần thông tin về tỉ lệ kết quả đầu ra cũng như thông tin hữu ích cho việc dự đoán kết quả đầu ra trong bối cảnh mới (theo dõi tim mạch). Điều này đặc biệt khó khăn khi dự đoán là về sự kiện trong tương lai. Để đưa ra sự dự đoán này, bạn cần dữ liệu ở thời điểm bạn cần đưa ra sự dự đoán.
Rất nhiều ứng dụng AI thương mại có cấu trúc như sau: sử dụng sự kết hợp của dữ liệu đầu vào và kết quả đầu ra ước tính để tạo ra máy dự đoán, và rồi sử dụng dữ liệu đầu vào từ một tình huống mới để dự đoán kết quả đầu ra của tình huống đó. Nếu bạn có thể thu thập dữ liệu từ kết quả đầu ra đó, máy dự đoán của bạn có thể học hỏi liên tục thông qua phản hồi.
Quyết định liên quan đến dữ liệu
Dữ liệu thường sẽ rất tốn kém để có được, nhưng máy dự đoán không thể hoạt động mà không có nó. Máy dự đoán cần dữ liệu để tạo ra, hoạt động và cải thiện.
Do đó, bạn phải đưa ra quyết định về quy mô và phạm vi của việc thu thập dữ liệu. Bạn cần bao nhiêu loại dữ liệu khác nhau? Cần bao nhiêu đối tượng khác nhau để đào tạo máy? Tần suất bạn cần thu nhập dữ liệu? Càng nhiều loại, càng nhiều đối tượng, tần suất càng lớn đồng nghĩa với giá thành càng cao nhưng càng có khả năng thu lợi nhuận lớn. Khi suy nghĩ về quyết định này, bạn cần phải cẩn thận xác định điều bạn muốn dự đoán. Vấn đề dự đoán cụ thể sẽ nói cho bạn biết bạn cần cái gì.
Cardiogram muốn dự đoán số lần đột quỵ. Họ sử dụng nhịp tim bất thường như là một sự đại diện (đã được chứng nhận về mặt y khoa).4 Một khi họ đặt ra mục tiêu dự đoán, họ chỉ cần dữ liệu nhịp tim của mỗi người dùng ứng dụng. Họ có thể cần thông tin về giấc ngủ, hoạt động thể chất, gia đình, bệnh sử và tuổi tác. Sau khi hỏi một vài câu hỏi để thu nhập thông tin về tuổi tác và những thông tin khác, họ chỉ cần một thiết bị để đo lường chuẩn nhịp tim.
Cardiogram cũng cần dữ liệu để đào tạo – 6.000 người trong hệ thống dữ liệu đào tạo của họ, một phần trong số đó có nhịp tim bất thường. Mặc dù có nhiều loại máy cảm biến và nhiều chi tiết khác nhau về người dùng có thể có
sẵn, Cardiogram chỉ cần thu nhập số lượng ít thông tin về hầu hết người dùng của họ. Và họ chỉ cần thông tin về nhịp tim bất thường từ những người mà họ dùng để đào tạo máy AI của họ. Bằng cách này, số biến là tương đối nhỏ.
Để có thể đưa ra sự dự đoán tốt, máy cần có đủ cá thể (hoặc đơn vị phân tích) trong dữ liệu đào tạo. Số cá thể cần có phụ thuộc vào hai yếu tố: đầu tiên, độ nhạy của “tín hiệu” với “tiếng ồn”, và thứ hai, độ chính xác của sự dự đoán để trở nên hữu dụng. Hay nói cách khác, số lượng cá thể cần có phụ thuộc vào việc nhịp tim là yếu tố dự đoán nhịp tim bất thường mạnh hay yếu và sự tốn kém mà sai sót có thể gây ra. Nếu nhịp tim là yếu tố dự đoán mạnh và sai sót không quan trọng, vậy thì chúng ta chỉ cần một vài người. Nếu nhịp tim là yếu tố dự đoán yếu và mỗi sai sót có thể gây nguy hiểm cho tính mạng, thì chúng ta cần hàng nghìn thậm chí là hàng triệu cá thể. Cardiogram đã sử dụng thông tin của 6.000 người trong nghiên cứu sơ bộ của họ, bao gồm chỉ 200 người với nhịp tim bất thường. Theo thời gian, một cách để thu thập thêm dữ liệu là từ phản hồi của việc liệu những người sử dụng ứng dụng có nhịp tim bất thường hay không.
Vậy con số 6.000 từ đâu ra? Những nhà khoa học dữ liệu có những công cụ tuyệt vời để đánh giá khối lượng dữ liệu cần có để thu được sự dự đoán đáng tin và chính xác. Những công cụ này được gọi là “tính toán công suất” và chúng sẽ nói cho bạn biết cần bao nhiêu đơn vị phân tích để cho ra sự dự đoán hữu ích.5 Điểm quản lý nổi bật là bạn cần phải thực hiện một sự đánh đổi: sự dự đoán càng chính xác sẽ yêu cầu nhiều đơn vị hơn để nghiên cứu, và để có được những đơn vị bổ sung này có thể sẽ rất tốn kém.
Cardiogram yêu cầu tần suất cao của việc thu nhập dữ liệu. Công nghệ của họ sử dụng Apple Watch để thu nhập dữ liệu trên nền tảng từng giây. Họ cần tần suất cao như vậy vì nhịp tim dao động trong ngày và sự đo lường chính xác yêu cầu sự đánh giá lặp đi lặp lại để xem liệu tỷ lệ đo được có phải là giá trị đúng với người họ đang làm nghiên cứu không. Để hoạt động, thuật toán của Cardiogram sử dụng dòng đo lường ổn định mà một thiết bị đeo tay có thể cung cấp, thay vì sự đo lường chỉ có thể làm được khi bệnh nhân ở phòng khám của bác sĩ.
Thu thập loại dữ liệu này là một sự đầu tư tốn kém. Bệnh nhân phải đeo thiết bị mọi lúc nên nó ảnh hưởng đến hoạt động hằng ngày của họ (đặc biệt là với những người không có Apple Watch). Bởi vì nó liên quan đến dữ liệu sức
khoẻ, nhiều sự lo ngại về vấn đề quyền riêng tư đã nảy sinh, vì vậy Cardiogram đã phát triển hệ thống để cải thiện quyền riêng tư nhưng với chi phí phát triển gia tăng và làm giảm khả năng của máy để cải thiện sự dự đoán từ phản hồi. Nó thu thập dữ liệu sử dụng để dự đoán thông qua ứng dụng; dữ liệu vẫn lưu lại trên máy.
Tiếp đến, chúng tôi sẽ thảo luận về điểm khác biệt giữa suy nghĩ về mặt thống kê và suy nghĩ về mặt kinh tế liên quan đến số lượng dữ liệu thu thập được. (Chúng tôi sẽ xem xét những vấn đề liên quan đến quyền riêng tư khi bàn về chiến lược ở phần thứ tư).
Quy mô kinh tế
Nhiều dữ liệu cải thiện sự dự đoán. Nhưng bạn cần bao nhiêu dữ liệu? Lợi ích của việc có thêm thông tin (cho dù là về số lượng đơn vị, loại biến hay tần suất) có thể sẽ làm tăng hoặc giảm với số lượng dữ liệu hiện có. Dưới góc nhìn của chuyên gia kinh tế, dữ liệu có thể tăng hoặc giảm theo hiệu suất quy mô.
Từ quan điểm thống kê đơn thuần, dữ liệu đã giảm theo hiệu suất quy mô. Bạn có nhiều thông tin hữu ích từ lần quan sát thứ 3 hơn là lần quan sát thứ 100 và bạn học hỏi nhiều hơn từ lần thứ 100 hơn là lần thứ 1 triệu. Khi bạn bổ sung các lần quan sát vào dữ liệu đào tạo của mình, nó sẽ trở nên ít hữu ích hơn trong việc cải thiện sự dự đoán của bạn.
Mỗi quan sát là một sự bổ sung dữ liệu cho sự dự đoán của bạn. Trong trường hợp của Cardiogram, sự quan sát là thời gian giữa những nhịp tim được ghi lại. Khi chúng tôi nói “dữ liệu đã giảm theo hiệu suất quy mô”, chúng tôi muốn nói rằng nhịp tim thứ 100 đầu tiên sẽ cho bạn biết liệu người đó có nhịp tim bất thường hay không. Mỗi nhịp tim sau đó sẽ ít quan trọng hơn những nhịp tim trước đó trong việc cải thiện sự dự đoán.
Hãy nghĩ đến thời gian mà bạn cần rời đi khi bạn định đến sân bay. Nếu bạn chưa từng đến sân bay bao giờ, lần đầu tiên bạn đi sẽ đem lại nhiều thông tin hữu ích. Lần thứ hai và lần thứ ba cũng sẽ cho bạn cảm nhận về việc mất bao lâu. Tuy nhiên, cho đến lần thứ 100, có thể bạn sẽ không học hỏi được nhiều nữa. Như vậy, dữ liệu đã giảm theo hiệu suất quy mô: khi bạn càng có nhiều dữ liệu, mỗi thông tin thêm vào sau đó càng ít có giá trị hơn.
Điều này có thể không đúng từ quan điểm kinh tế, vì nó không liên quan đến việc dữ liệu có thể cải thiện sự dự đoán ra sao. Nó liên quan đến việc dữ liệu có thể cải thiện giá trị bạn nhận được từ sự dự đoán. Đôi khi sự dự đoán và kết quả đầu ra đi cùng nhau, nên sự giảm theo hiệu suất quy mô trong quan sát thống kê ngụ ý đến kết quả đầu ra mà bạn quan tâm. Tuy nhiên, mọi chuyện không phải lúc nào cũng vậy.
Người tiêu dùng có thể lựa chọn sản phẩm của bạn hoặc đối thủ của bạn. Họ có thể chỉ sử dụng sản phẩm của bạn nếu như nó gần như luôn tốt bằng hoặc hơn sản phẩm từ đối thủ của bạn. Trong nhiều trường hợp, tất cả đối thủ cạnh tranh sẽ tốt ngang nhau trong những tình huống với những dữ liệu có sẵn. Ví
dụ, hầu hết các công cụ tìm kiếm cung cấp những kết quả tương tự cho những tìm kiếm phổ biến. Cho dù bạn sử dụng Google hay Bing, những kết quả từ tìm kiếm “Justin Bieber” đều tương tự nhau. Giá trị của công cụ tìm kiếm được thúc đẩy bởi khả năng cung cấp kết quả tốt hơn cho những tìm kiếm không phổ biến bằng. Hãy thử gõ từ “sự gián đoạn” (disruption) vào Google và Bing. Vào thời điểm viết cuốn sách này, Google cho ra cả hai định nghĩa trong từ điển và những kết quả liên quan đến ý tưởng của Clay Christensen về siêu đổi mới. Chín kết quả đầu tiên của Bing cho ra định nghĩa trong từ điển. Lý do chính khiến kết quả tìm kiếm của Google tốt hơn là bởi để tìm ra điều mà người dùng cần trong kết quả tìm kiếm không phổ biến đòi hỏi nhiều dữ liệu. Đa số mọi người sử dụng Google cho những tìm kiếm không phổ biến và tìm kiếm phổ biến. Việc có khả năng tìm kiếm dù chỉ là tốt hơn một chút có thể dẫn đến sự cách biệt to lớn về thị phần và doanh thu.
Vì vậy, khi dữ liệu về mặt kỹ thuật giảm theo hiệu suất quy mô – kết quả tìm kiếm thứ một tỷ sẽ ít hữu ích cho việc cải thiện công cụ tìm kiếm hơn kết quả tìm kiếm đầu tiên – từ quan điểm kinh doanh, dữ liệu có thể sẽ có giá trị nhất nếu bạn có nhiều dữ liệu tốt hơn so với đối thủ cạnh tranh. Một vài người lập luận rằng nhiều dữ liệu độc đáo sẽ lại những lợi ích không cân xứng trên thị
trường.6 Sự gia tăng lượng dữ liệu mang đến những lợi ích không cân xứng trên thị trường. Do vậy, từ quan điểm kinh tế, dữ liệu trong những trường hợp đó đã tăng theo hiệu suất quy mô.
NHỮNG ĐIỂM CHÍNH
• Máy dự đoán tận dụng ba loại dữ liệu: (1) dữ liệu đào tạo để đào tạo AI, (2) dữ liệu đầu vào để dự đoán và (3) dữ liệu phản hồi để cải thiện độ chính xác
của sự dự đoán.
• Việc thu thập dữ liệu là tốn kém; nhưng đó là một khoản đầu tư. Chi phí của việc thu thập dữ liệu phụ thuộc vào lượng bạn cần và mức độ xâm nhập của quá trình thu thập như thế nào. Việc cân bằng chi phí thu thập dữ liệu với lợi ích của việc nâng cao độ chính xác của sự dự đoán là vô cùng quan trọng. Việc xác định cách tiếp cận tốt nhất yêu cầu ước tính ROI của mỗi loại dữ liệu: chi phí để có được nó là bao nhiêu và mức độ giá trị gia tăng liên quan đến độ chính xác của sự dự đoán sẽ như thế nào?
• Những lý giải về mặt thống kê và về mặt kinh tế định hình việc liệu có thêm nhiều dữ liệu sẽ mang lại giá trị hơn hay không. Từ quan điểm thống kê, dữ liệu đã giảm theo hiệu suất quy mô. Mỗi đơn vị dữ liệu bổ sung cải thiện sự dự đoán ít hơn những dữ liệu trước đó; lần quan sát thứ 10 cải thiện sự dự đoán nhiều hơn so với lần quan sát thứ 100. Về mặt kinh tế, mối quan hệ này là mơ hồ. Việc thêm nhiều dữ liệu vào khối lượng lớn dữ liệu hiện có sẽ tốt hơn việc thêm vào khối lượng nhỏ - ví dụ, nếu lượng dữ liệu bổ sung cho phép hiệu suất của máy dự đoán vượt ngưỡng từ không thể sử dụng thành sử dụng được, hoặc từ dưới mức hiệu suất quy định thành vượt mức, hoặc từ việc kém hơn đối thủ cạnh tranh thành hơn đối thủ cạnh tranh. Do vậy, các tổ chức cần hiểu mối quan hệ giữa việc bổ sung thêm dữ liệu, nâng cao độ chính xác của sự dự đoán và gia tăng giá trị tạo thành.
6Sự phân chia lao động mới
M
ỗi lần bạn thay đổi một tài liệu điện tử, những sự thay đổi đó đều có thể được lưu lại. Với đa số chúng ta, nó không hẳn là cách hữu ích để theo dõi những thay đổi, nhưng với Ron Glozman, đây là cơ hội sử dụng AI trong dữ liệu để dự đoán những sự thay đổi. Vào năm 2015, Glozman sáng lập một công ty khởi nghiệp tên là Chisel, công ty đầu tiên có sản phẩm sở hữu tài liệu pháp lý và dự đoán những thông tin nào là bảo mật. Sản phẩm này có giá trị với những công ty luật bởi khi họ được yêu cầu tiết lộ tài liệu, họ phải biên soạn lại những thông tin bảo mật. Trong lịch sử, việc biên soạn được thực hiện bởi con người bằng cách đọc lại tài liệu và biên soạn lại thông tin bảo mật. Cách tiếp cận của Glozman hứa hẹn sẽ giúp tiết kiệm thời gian và công sức.
Máy biên soạn làm việc hiệu quả, nhưng không hoàn hảo. Đôi lúc máy chỉnh sửa sai thông tin cần tiết lộ hoặc máy không tìm được thông tin cần bảo mật. Để đạt được chuẩn mực pháp lý, cần phải có sự giúp đỡ của con người. Trong giai đoạn thử nghiệm, máy của Chisel đưa ra gợi ý thông tin gì cần biên soạn lại và con người từ chối hoặc chấp nhận sự gợi ý đó. Như vậy, khi kết hợp làm việc đồng nghĩa với việc tiết kiệm nhiều thời gian, trong khi đạt được tỉ lệ sai sót thấp hơn so với khi con người tự làm việc. Sự phân chia lao động con người-máy móc này hoạt động hiệu quả vì nó vượt qua được những điểm yếu của con người về tốc độ và sự chú ý cũng như những điểm yếu của máy móc về việc diễn giải văn bản.
Con người và máy móc đều có những thất bại. Nếu không biết chúng là gì thì chúng ta không thể đánh giá cách mà máy móc và con người nên làm việc cùng nhau để tạo ra sự dự đoán. Vì sao? Bởi vì một tư duy kinh tế của Adam Smith từ thế kỷ 18 về sự phân chia lao động bao gồm sự phân chia vai trò dựa trên những điểm mạnh tương đối. Ở đây, sự phân chia lao động là giữa con người và máy móc trong việc tạo ra sự dự đoán. Vậy sự phân chia lao động được hiểu là chúng ta sẽ phải xác định những yếu tố dự đoán nào con người hay máy móc thực hiện tốt nhất. Điều này cho phép chúng ta xác định được những vai trò cụ thể.
Việc mà con người dự đoán không giỏi
Một bài thí nghiệm tâm lý trước đây cho các đối tượng một chuỗi X và O ngẫu nhiên và yêu cầu con người dự đoán chữ cái tiếp theo sẽ là gì. Ví dụ, họ có thể thấy chuỗi:
O X X O X O X O X O X X O O X X O X O X X X O X X
Với một chuỗi như vậy, đa số mọi người nhận ra rằng có nhiều X hơn O một chút – nếu bạn đếm, bạn sẽ thấy có 60% X, 40% O – vì vậy đa số họ đoán X, nhưng đưa vào một số O để thể hiện sự cân bằng. Tuy nhiên, nếu bạn muốn tối đa hóa cơ hội dự đoán đúng, bạn sẽ luôn chọn X. Vậy thì 60% bạn sẽ đúng. Nếu bạn ngẫu nhiên ở tỉ lệ 60/40, như đa số người tham gia vào thí nghiệm, sự dự đoán của bạn sẽ đúng 52%, chỉ tốt hơn một chút so với nếu bạn không quan tâm đến việc đánh giá tần suất tương đối của X và O và thay vào đó là đoán chữ cái này hoặc chữ cái kia (50/50).1
Những thí nghiệm như vậy nói cho chúng ta biết con người không giỏi trong việc thống kê, ngay cả trong những tình huống mà họ không đến nỗi quá tệ ở việc đánh giá khả năng. Máy dự đoán sẽ không mắc lỗi như vậy. Nhưng có lẽ
con người không quá để tâm đến những việc như vậy, vì họ cảm thấy rằng mình chỉ đang chơi một trò chơi. Liệu họ có mắc những lỗi tương tự nếu kết quả không giống như một trò chơi? Câu trả lời – được chứng minh qua nhiều thí nghiệm bởi hai nhà tâm lý học Daniel Kahneman và Amos Tversky – là chắc chắn có.2
Khi hai nhà tâm lý quan sát những người tham gia nghiên cứu xem xét hai bệnh viện – một bệnh viện với 45 ca sinh mỗi ngày và bệnh viện còn lại với 15 ca sinh mỗi ngày – và hỏi rằng bệnh viện nào sẽ có nhiều ngày mà số bé trai được sinh ra chiếm 60% trở lên hơn, rất ít người trả lời đúng – bệnh viện có quy mô nhỏ hơn. Bệnh viện có quy mô nhỏ hơn là đáp án đúng vì số lượng sự kiện nhiều hơn (ở trường hợp này, ca sinh), khả năng cao rằng kết quả mỗi ngày sẽ gần với mức trung bình hơn (ở trường hợp này, 50%). Do đó, bệnh viện có quy mô nhỏ hơn – là đáp án đúng vì họ có ít ca sinh hơn – có khả năng đem lại kết quả vượt xa mức trung bình.
Nhiều cuốn sách đã viết về những phương pháp tiếp cận bằng cảm tính và
thành kiến như vậy.3 Nhiều người thấy khó khăn với việc đưa ra dự đoán dựa trên nguyên tắc thống kê hợp lý, đó chính xác là lý do vì sao họ cho mời những chuyên gia. Thật không may, những chuyên gia đó có thể thể hiện những thành kiến và khó khăn tương tự với số liệu thống kê khi đưa ra quyết định. Những thành kiến như vậy gây ảnh hưởng xấu đến những ngành đa dạng như y học, luật, thể thao và kinh doanh. Tversky, cùng với những chuyên gia nghiên cứu tại Trường Y Harvard, giới thiệu đến bác sĩ hai phương pháp điều trị ung thư phổi: xạ trị hoặc phẫu thuật. Tỉ lệ sống sót ghi nhận trong năm năm khuyên nên phẫu thuật. Hai nhóm người tham gia đã nhận được nhiều cách biểu đạt thông tin khác nhau về tỉ lệ thành công ngắn hạn của phẫu thuật, phương pháp nguy hiểm hơn là xạ trị. Khi được nói rằng “tỉ lệ sống sót trong tháng đầu tiên là 90%”, 84% bác sĩ chọn phẫu thuật, nhưng tỉ lệ này giảm xuống còn 50% khi được nói là “có 10% tỉ lệ tử vong trong tháng đầu tiên”. Cả hai cụm đều truyền tải cùng một điều, nhưng cách các chuyên gia nghiên cứu xây dựng thông tin ảnh hưởng dẫn đến thay đổi lớn trong quyết định. Máy móc sẽ không cho ra kết quả này.
Kahneman xác định được những tình huống khác khi những chuyên gia không giỏi dự đoán phải đối mặt với thông tin phức tạp. Những bác sĩ X quang giàu kinh nghiệm tự mâu thuẫn với bản thân họ 1/5 lần khi đánh giá kết quả X-quang. Kiểm toán viên, nhà bệnh lý học, nhà tâm lý học và quản lý cũng thể hiện sự dao động tương tự. Kahneman kết luận rằng nếu như có cách dự đoán sử dụng một công thức thay vì một con người, công thức sẽ được xem xét nghiêm túc.
Sự dự đoán không tốt từ chuyên gia là trọng tâm của bộ phim Moneyball (tạm dịch: Cuộc chiến sân cỏ) của Michael Lewis.4 Đội bóng chày Oakland Athletics gặp phải một vấn đề sau khi ba trong số những cầu thủ giỏi nhất rời đội, đội không còn đủ nguồn tài chính để tuyển thêm cầu thủ thay thế. Giám đốc điều hành câu lạc bộ Oakland Athletics, Billy Beane (do Brad Pitt thủ vai trong phim) sử dụng một hệ thống thống kê được phát triển bởi Bill James để dự đoán hiệu suất của cầu thủ. Với hệ thống “thuật toán bóng chày” này, Beane và những chuyên gia phân tích đã bác bỏ những lời đề xuất của những người huấn luyện viên của câu lạc bộ và chọn đội riêng của họ. Cho dù với ngân sách khiêm tốn, đội đã vượt qua những đối thủ để đến với World Series vào năm 2002. Trọng tâm của cách tiếp cận mới này là việc tránh xa những chỉ số mà họ từng nghĩ là quan trọng (ví dụ như số lần cướp gôn và mức đánh
bóng trung bình) để tập trung vào những chỉ số khác (ví dụ như hiệu suất cầu thủ tại gôn và phần trăm đánh bóng trong sân). Đồng thời cũng tránh xa phương pháp tiếp cận suy nghiệm kỳ quái của vị huấn luyện viên. Với thuật toán liên quan đến quá trình đưa ra quyết định như vậy, không ngạc nhiên khi sự dự đoán được thúc đẩy bởi dữ liệu thường có khả năng vượt xa những sự dự đoán của con người trong bóng chày.
Số liệu mới được chú ý này lý giải sự đóng góp của các cầu thủ đến hiệu suất tổng thể của đội. Máy dự đoán mới cho phép đội Oakland Athletics xác định những cầu thủ chơi kém hơn so với những cầu thủ được đánh giá theo cách truyền thống và do đó có giá trị tốt hơn về mặt chi phí tương quan với sự ảnh hưởng của họ lên hiệu suất của đội. Đội Oakland Athletics đã tập trung vào những ưu tiên đó.5
Có lẽ thể hiện rõ ràng nhất của sự khó khăn trong dự đoán của con người, ngay cả với những chuyên gia kinh nghiệm và có ảnh hưởng lớn, đến từ nghiên cứu về những thẩm phán đưa ra quyết định về việc tại ngoại ở Hoa Kỳ.6 Ở Hoa Kỳ, có khoảng 10 triệu quyết định như vậy mỗi năm, và việc ai đó được tại ngoại hay không là rất quan trọng đối với gia đình, công việc và những vấn đề cá nhân khác, chưa kể đến chi phí nhà tù của chính phủ. Thẩm phán cần đưa ra quyết định dựa vào việc liệu bị cáo có bỏ trốn hoặc thực hiện những tội ác khác hay không nếu được tại ngoại, chứ không phải liệu một bản án kết tội khác có khả năng xảy ra hay không. Các tiêu chí quyết định rõ ràng và được định nghĩa cụ thể. Các nhà nghiên cứu sử dụng máy tự học để phát triển thuật toán dự đoán khả năng một bị cáo cụ thể có tái phạm pháp hay bỏ trốn trong khi tại ngoại hay không. Dữ liệu đào tạo có tính bao quát: 3/4 trong số hàng triệu người được phép tại ngoại ở thành phố New York từ năm 2008 đến 2013 đều tái phạm pháp. Thông tin bao gồm những bản ráp trước đó, những tội danh bị buộc tội và thông tin về nhân khẩu học.
Máy đưa ra dự đoán tốt hơn thẩm phán. Ví dụ, với 1% số bị cáo máy phân loại là nguy hiểm nhất, nó dự đoán rằng 62% trong số đó sẽ tái phạm pháp trong thời gian tại ngoại. Tuy nhiên, thẩm phán (người không được tiếp cận với sự dự đoán của máy) có khả năng sẽ cho gần một nửa số người đó tại ngoại. Sự dự đoán của máy là chính xác một cách hợp lý, với 63% số bị cáo được phân loại là nguy hiểm thực tế đã phạm pháp trong thời gian tại ngoại và hơn một nửa số đó không xuất hiện ở ngày hầu tòa tiếp theo. 5% trong số
đó máy xác định là nguy hiểm cao đã phạm tội hiếp dâm hoặc giết người trong thời gian tại ngoại. Bằng cách làm theo những lời đề xuất của máy, thẩm phán có thể cho tại ngoại với số lượng tương đương và giảm thiểu tỉ lệ phạm tội của những người tại ngoại đến 3/4. Hoặc họ có thể giữ nguyên tỉ lệ phạm tội và bắt tù thêm một nửa số bị cáo khác.7
Vậy điều gì đang diễn ra ở đây? Vì sao thẩm phán lại có sự đánh giá khác biệt đến vậy so với máy dự đoán? Một khả năng có thể là thẩm phán sử dụng thông tin không có sẵn với thuật toán, ví dụ như biểu hiện và thái độ của bị cáo trên tòa án. Thông tin đó có thể hữu ích – hoặc có thể gây đánh lừa. Với tỉ lệ tái phạm tội cao như vậy của những người được tại ngoại, không vô lý khi kết luận rằng có nhiều khả năng sự dự đoán của các thẩm phán thực sự khá tệ. Nghiên cứu cung cấp nhiều bằng chứng khác để ủng hộ cho kết luận không may này.
Sự dự đoán trở nên khó khăn với con người trong tình huống này bởi sự phức tạp của những yếu tố có thể giải thích cho tỉ lệ phạm tội. Máy dự đoán tốt hơn con người ở việc phân loại các yếu tố tương tác phức tạp giữa những chỉ số khác nhau. Vậy nên, khi bạn nghĩ rằng hồ sơ tội phạm trong quá khứ có thể khiến bị cáo có khả năng bỏ chạy cao hơn, máy đã có thể phát hiện rằng đó chỉ là trong trường hợp bị cáo đã bị thất nghiệp trong một khoảng thời gian nhất định. Nói cách khác, hiệu ứng tương tác có thể là yếu tố quan trọng nhất, và khi số lượng của những tương tác đó gia tăng, khả năng con người có thể đưa ra sự dự đoán chính xác suy giảm.
Những thành kiến này không những chỉ có trong trong y học, bóng chày và luật pháp; chúng còn là yếu tố trong công việc chuyên môn. Các chuyên gia kinh tế học đã nhận ra rằng những người quản lý và người làm việc thường đưa ra dự đoán – với sự tự tin – mà không nhận ra rằng họ đang làm không
tốt. Trong nghiên cứu về việc tuyển dụng của 15 công ty luật có tay nghề thấp, Mitchell Hoffman, Lisa Kahn và Danielle Li nhận ra rằng khi công ty sử dụng bài kiểm tra khách quan và có thể đánh giá trong những buổi phỏng vấn bình thường, thời gian gắn bó của ứng viên tăng 15% so với khi họ đưa ra quyết định tuyển dụng dựa vào việc phỏng vấn.8 Với những công việc như vậy, những nhà quản lý thường được hướng dẫn để tối đa hóa thời gian gắn bó của ứng viên. Bản thân bài kiểm tra đã mang tính bao quát rộng, bao gồm khả năng nhận thức và những yếu tố thích hợp với công việc. Ngoài ra, ngay
cả khi quyết định tuyển dụng của người quản lý bị hạn chế - ngăn cản người quản lý phủ nhận kết quả kiểm tra khi điểm số không như mong muốn – tỉ lệ ứng viên gắn bó gia tăng và tỉ lệ thôi việc giảm vẫn xảy ra.
Việc mà máy dự đoán không giỏi
Cựu thư ký của Bộ Quốc phòng Donald Rumsfeld từng nói:
Có những điều đã biết là đã biết; có những điều chỉ có chúng ta biết là chúng ta biết. Chúng ta cũng biết rằng có những điều đã biết là chưa biết; tức là có những điều chúng ta biết là chưa biết. Nhưng cũng có những điều chưa biết là chưa biết – những điều mà chúng ta chưa biết là chúng ta chưa biết. Và nếu ai đó nhìn vào lịch sử của đất nước chúng ta và những quốc gia độc lập khác, họ sẽ có xu hướng thấy những quốc gia độc lập khác khó đoán hơn.9
Điều này cung cấp một cấu trúc hữu ích để hiểu về những điều kiện khiến máy dự đoán lưỡng lự. Đầu tiên, những điều chúng ta biết là đã biết là khi chúng ta có lượng dữ liệu phong phú, chúng ta biết rằng mình có thể đưa ra sự dự đoán tốt. Thứ hai, những điều chúng ta biết là chưa biết là khi có quá ít dữ liệu, chúng ta biết rằng việc dự đoán sẽ khó khăn. Thứ ba, những điều chúng ta chưa biết là chúng ta chưa biết là những sự kiện chưa được thu thập thông tin từ quá khứ hoặc đã có sẵn ở dữ liệu hiện tại nhưng không khả thi, nên việc dự đoán là khó khăn, mặc dù chúng ta có thể không nhận ra điều đó. Cuối cùng, một mục mà Rumsfeld không nhận ra, những điều chưa biết là đã biết, là khi một sự liên quan dường như rõ ràng trong quá khứ là kết quả của một yếu tố chưa biết hoặc chưa được quan sát nhưng có thể thay đổi theo thời gian và khiến sự dự đoán của chúng ta trở nên không đáng tin cậy.
Những điều biết là đã biết
Với khối lượng dữ liệu phong phú, máy dự đoán có thể hoạt động tốt. Máy biết rõ tình hình và nó có thể cung cấp sự dự đoán tốt. Và chúng ta biết rằng sự dự đoán sẽ tốt. Đây chính là điểm mạnh của thế hệ trí tuệ nhân tạo hiện giờ. Phát hiện lừa đảo, chẩn đoán y khoa, cầu thủ bóng chày và quyết định tại ngoại đều nằm trong mục này.
Những điều đã biết là chưa biết
Ngay cả những mô hình dự đoán tốt nhất hiện nay (và trong tương lai gần) đòi hỏi lượng dữ liệu lớn, đồng nghĩa với việc chúng ta biết rằng sự dự đoán sẽ có thể tương đối không tốt trong những tình huống mà chúng ta không có nhiều dữ liệu. Chúng ta biết rằng là chúng ta không biết: những điều đã biết là chưa biết.
Chúng ta có thể không có nhiều dữ liệu vì một số sự kiện rất hiếm xảy ra, nên việc dự đoán chúng là một thử thách. Những cuộc bầu cử tổng thống Hoa Kỳ diễn ra bốn năm một lần, những ứng viên và môi trường bầu cử thay đổi. Dự
đoán kết quả bầu cử tổng thống trong một vài năm tới là điều bất khả thi. Cuộc bầu cử năm 2016 đã cho thấy rằng dự đoán kết quả trước một vài ngày, hay thậm chí là trong ngày bầu cử là rất khó. Những trận động đất lớn thường (và thật may mắn) rất hiếm nên việc dự đoán thời gian, địa điểm và độ lớn của chúng đến nay vẫn rất khó. (Các nhà địa chấn học vẫn đang nghiên cứu vấn đề này).10
Trái ngược với máy móc, con người đôi khi giỏi dự đoán với lượng ít dữ liệu. Chúng ta có thể nhận ra khuôn mặt chỉ sau khi thấy một hoặc hai lần, thậm chí ngay cả khi chúng ta nhìn từ góc độ khác. Chúng ta có thể nhận ra bạn học cùng lớp 4 vào 40 năm sau, cho dù có nhiều thay đổi về ngoại hình. Chúng ta cũng giỏi trong việc so sánh, đem những tình huống mới và xác định những hoàn cảnh khác có điểm tương tự đủ để hữu ích trong một môi trường mới.11
Các nhà khoa học máy tính đang nghiên cứu việc giảm nhu cầu dữ liệu mà máy cần, phát triển các kỹ thuật ví dụ như “học một lần” mà máy học cách dự đoán một đối tượng đủ tốt chỉ sau một lần nhìn thấy, hiện tại thì máy dự đoán chưa đủ tốt để làm điều đó.12 Bởi vì có những điều đã biết là chưa biết và vì con người vẫn giỏi trong việc đưa ra quyết định với những điều đã biết là chưa biết, những con người quản lý máy biết rằng những tình huống như vậy có thể phát sinh và vì vậy họ có thể lập trình máy để gọi con người khi cần giúp đỡ.
Những điều chưa biết là chưa biết
Để dự đoán, một người cần cho máy biết điều gì đáng để dự đoán. Nếu một điều chưa từng xảy ra trước đó, máy không thể dự đoán được (ít nhất là nếu
không có sự phán đoán cẩn thận của con người để cung cấp sự so sánh hữu ích cho phép máy dự đoán sử dụng thông tin về một điều khác).
Nassim Nicholas Taleb tập trung nhấn mạnh về những điều chưa biết là chưa biết trong cuốn sách The Black Swan (tạm dịch: Thiên nga đen) của ông.13Ông nhấn mạnh rằng chúng ta không thể dự đoán những sự kiện hoàn toàn mới từ dữ liệu trong quá khứ được. Tiêu đề của cuốn sách đề cập đến sự phát hiện của người châu Âu về một loại thiên nga mới ở Úc. Với những người châu Âu của thế kỷ 18, thiên nga có màu trắng. Cho đến khi tới Úc, họ nhìn thấy một điều hoàn toàn mới và không thể đoán trước được: thiên nga đen. Họ chưa từng nhìn thấy thiên nga đen và vì vậy họ không hề có thông tin để có thể dự đoán sự tồn tại của loài thiên nga này.14 Taleb cho rằng sự xuất hiện của những điều chưa biết là chưa biết khác có hệ quả quan trọng – không giống như sự xuất hiện của những con thiên nga đen, một sự xuất hiện ít có ảnh hưởng đến định hướng của xã hội châu Âu hay châu Úc.
Ví dụ, những năm 1990 là thời điểm tốt để gia nhập vào ngành công nghiệp âm nhạc.15 Doanh số bán đĩa CD gia tăng và doanh thu tăng trưởng ổn định. Tương lai trông rất xán lạn. Và rồi vào năm 1999, Shawn Fanning, 18 tuổi khi đó phát triển Napster, một chương trình cho phép mọi người chia sẻ file âm nhạc miễn phí trên Internet. Nhanh chóng, mọi người bắt đầu tải xuống hàng triệu file như vậy và nền công nghiệp âm nhạc bắt đầu đi xuống. Ngành công nghiệp này hiện giờ vẫn chưa thể phục hồi.
Phải thừa nhận rằng, con người cũng tương đối không giỏi trong việc dự đoán những điều chưa biết là chưa biết. Khi đối mặt với những điều chưa biết là chưa biết, cả con người và máy móc đều thất bại.
Những điều chưa biết là đã biết
Có lẽ điểm yếu lớn nhất của máy dự đoán là chúng đôi khi cung cấp những câu trả lời sai mà chúng lại tự tin rằng mình đúng. Như chúng tôi đã mô tả ở trên, trong trường hợp những điều đã biết là chưa biết, con người hiểu rõ độ thiếu chính xác của sự dự đoán. Sự dự đoán mang đến một sự tự tin mà cho
thấy sự thiếu chính xác của nó. Trong trường hợp những điều chưa biết là chưa biết, con người không có bất kỳ câu trả lời nào. Ngược lại, với những điều chưa biết là đã biết, máy dự đoán dường như có thể cung cấp một câu trả
lời vô cùng chính xác, nhưng câu trả lời đó có thể sai. Tại sao điều này lại xảy ra? Bởi vì, trong khi dữ liệu tạo thành những quyết định, dữ liệu cũng có thể đến từ những quyết định. Nếu máy không hiểu quá trình đưa ra quyết định tạo ra dữ liệu, sự dự đoán của nó có thể thất bại. Ví dụ, nếu bạn quan tâm đến việc dự đoán rằng liệu bạn sẽ sử dụng máy dự đoán trong tổ chức của bạn hay không. Bạn đang bắt đầu rất vì việc bạn đọc cuốn sách này tức là bạn đã có được yếu tố dự đoán tuyệt vời để trở thành một người quản lý có thể sử dụng máy dự đoán.
Vì sao? Vì ít nhất ba lý do sau. Đầu tiên và trực tiếp nhất, những thông tin sâu sắc trong cuốn sách này sẽ trở nên hữu ích, vì vậy việc đọc cuốn sách này sẽ khiến bạn muốn học về máy dự đoán và áp dụng những công cụ này vào trong doanh nghiệp của bạn một cách hiệu quả.
Thứ hai là lý do gọi là “nhân quả nghịch”. Bạn đang đọc cuốn sách này vì bạn đã sử dụng máy dự đoán hoặc đã có những kế hoạch nhất định để làm như vậy trong tương lai gần. Cuốn sách này không nhằm hướng tới việc sử dụng công nghệ; thay vào đó, sự sử dụng công nghệ (có thể là đang trong giai đoạn chờ) khiến bạn đọc cuốn sách này.
Thứ ba là lí do gọi là “biến bị bỏ sót”. Bạn là người quan tâm tới những xu hướng công nghệ và quản lý. Vì vậy, bạn quyết định đọc cuốn sách này. Bạn cũng sử dụng tốt những công nghệ mới như máy dự đoán trong công việc. Trong trường hợp này, những sự yêu thích tiềm tàng với công nghệ và quản lý của bạn đã khiến bạn đọc cuốn sách này và sử dụng máy dự đoán.
Đôi khi sự phân biệt ở trên không quan trọng. Nếu tất cả những gì bạn quan tâm là liệu người đọc cuốn sách này sẽ sử dụng máy dự đoán hay không, thì điều gì dẫn đến điều gì không còn quan trọng.
Đôi khi sự khác biệt đó lại quan trọng. Nếu bạn đang nghĩ về việc giới thiệu cuốn sách này cho bạn bè, bạn sẽ làm như vậy nếu cuốn sách khiến bạn trở thành một người quản lý tốt hơn với máy dự đoán. Bạn muốn biết điều gì? Bạn sẽ bắt đầu với thực tế rằng bạn đã đọc cuốn sách này. Sau đó bạn muốn nhìn thấy tương lai và quan sát xem bạn quản lý AI giỏi thế nào. Giả sử bạn nhìn thấy một tương lai toàn hảo, bạn đã cực kỳ thành công trong việc quản lý máy dự đoán, nó trở thành cốt lõi trong tổ chức của bạn và bạn cùng tổ chức thành công ngoài sức mong đợi. Vậy bạn có thể nói rằng việc đọc cuốn
sách này dẫn đến sự thành công đó?
Không. Để tìm hiểu xem việc đọc cuốn sách này có ảnh hưởng như thế nào, bạn cũng cần biết xem điều gì sẽ xảy ra nếu bạn không đọc cuốn sách này. Bạn cần quan sát điều mà những chuyên gia kinh tế và nhà thống kê học gọi là “phản thực tế”: điều gì sẽ xảy ra nếu bạn thực hiện một hành động khác. Xác định xem liệu hành động đó có tạo ra một kết quả đòi hỏi hai sự dự đoán: đầu tiên, kết quả nào sẽ xảy ra sau khi hành động đó được thực hiện, và thứ hai, kết quả nào sẽ xảy ra nếu một hành động khác được thực hiện. Nhưng điều đó là bất khả thi. Bạn sẽ không bao giờ có dữ liệu của hành động không được thực hiện.16
Đây là vấn đề hiện tại của sự dự đoán bằng máy. Trong cuốn sách Deep Thinking (tạm dịch: Tư duy sâu), kiện tướng cờ vua Garry Kasporov thảo luận về vấn liên quan đến thuật toán máy tự học từ thời xưa của cờ vua:
Khi Michie và một vài đồng nghiệp viết chương trình thử nghiệm cờ vua cho máy tự học vào những năm đầu 1980, nó đã cho ra một kết quả thú vị. Họ đưa hàng trăm nước đi trong hàng nghìn ván kiện tướng vào máy, hy vọng nó có thể phát hiện ra cái nào hiệu quả và cái nào không. Đầu tiên nó có vẻ như hiệu quả. Sự đánh giá nước đi trở nên chính xác hơn so với những chương trình thông thường. Vấn đề xảy ra khi họ cho nó thực sự chơi một ván cờ vua. Chương trình phát triển các phần của nó, tấn công và lập tức mất con hậu! Nó thua chỉ trong vài bước cờ, hy sinh con hậu. Tại sao nó lại làm vậy? Khi một kiện tướng cờ hy sinh con hậu của anh ta, dường như đó là một nước đi tuyệt vời và quan trọng. Đối với máy, được đào tạo bởi những ván kiện tướng cờ, hy sinh con hậu của nó rõ ràng chính là chìa khóa thành công!17
Máy đã đảo ngược trình tự nhân quả. Không hiểu rằng việc kiện tướng hy sinh con hậu chỉ khi để có chiến thắng nhanh và gọn, máy đã học rằng nó sẽ chiến thắng nhanh chóng ngay sau khi hy sinh con hậu. Vậy nên việc hy sinh con hậu một cách sai lầm dường như là cách dẫn đến chiến thắng. Trong khi vấn đề cụ thể này về sự dự đoán của máy đã được giải quyết, sự đảo ngược nhân quả vẫn còn là một thử thách lớn cho máy dự đoán.
Vấn đề này dường như cũng xuất hiện thường xuyên trong kinh doanh. Trong nhiều ngành công nghiệp, giá thành rẻ thường gắn liền với doanh thu thấp. Ví
dụ, trong ngành công nghiệp khách sạn, giá thành thấp khi không trong mùa du lịch, giá thành cao khi nhu cầu cao và khách sạn hết phòng. Với dữ liệu đó, một dự đoán ngây ngô có thể gợi ý rằng việc tăng giá sẽ dẫn đến việc nhiều phòng được bán ra. Một người – ít nhất với một vài hiểu biết về kinh tế - sẽ hiểu rằng việc thay đổi giá thành có thể được gây ra bởi nhu cầu cao, chứ không phải điều ngược lại. Vậy nên việc tăng giá thành sẽ không tăng doanh thu. Người này sau đó có thể làm việc với máy để xác định đúng dữ liệu (ví dụ như những sự lựa chọn cá nhân về phòng khách sạn dựa vào giá thành) và những mô hình phù hợp (mà liên quan đến mùa cũng như những nhu cầu cung và cầu khác) để dự đoán doanh thu tốt hơn ở những giá thành khác nhau. Do vậy, đối với máy, đây là điều chưa biết là đã biết, nhưng với con người, với sự hiểu rõ cách giá thành được xác định, sẽ thấy đây là điều đã biết là chưa biết hoặc có thể là điều đã biết là đã biết nếu con người có thể xây dựng mô hình chính xác của việc định giá.
Vấn đề của những điều chưa biết là đã biết và suy luận nhân quả thậm chí còn quan trọng hơn khi có sự xuất hiện của những hành vi chiến lược khác. Những kết quả tìm kiếm của Google đến từ một thuật toán bí mật. Thuật toán đó phần lớn được xác định bởi máy dự đoán có khả năng dự đoán được những liên kết mà một ai đó có khả năng bấm vào. Với một người quản lý trang web, thứ hạng càng cao đồng nghĩa với việc nhiều người dùng tới trang web hơn và doanh thu nhiều hơn. Đa số những người quản lý trang web nhận ra điều này và thực hiện tối ưu hóa công cụ tìm kiếm: họ điều chỉnh trang web của họ để cố gắng cải thiện thứ hạng của họ trên những kết quả tìm kiếm của Google. Những sự điều chỉnh này thường là để đánh lừa tính riêng biệt thuật toán, và khi thời gian qua đi, công cụ tìm kiếm sẽ trở nên đầy rẫy những thông tin rác, những liên kết mà người tìm kiếm không thực sự muốn.
Máy dự đoán đã làm tốt trong khoảng thời gian ngắn về việc dự đoán những gì mọi người sẽ bấm vào. Nhưng sau vài tuần hoặc vài tháng, sẽ có những nhà quản lý trang web tìm cách thay đổi hệ thống mà Google cần để điều chỉnh mô hình dự đoán một cách đáng kể. Sự qua lại giữa công cụ tìm kiếm và web rác của công cụ tìm kiếm xảy ra bởi vì máy dự đoán có thể bị đánh lừa. Trong khi Google đã cố gắng tạo ra một hệ thống ngăn cản việc đánh lừa đó, nó cũng nhận ra những yếu điểm của việc phụ thuộc hoàn toàn vào máy dự đoán và sử dụng sự phán đoán của con người để xử lý những web rác đó.18Instagram cũng trải qua một cuộc chiến trường kì với thư rác, và ứng
dụng này thường xuyên cập nhật thuật toán để ngăn chặn thư rác và những thông tin mang tính xúc phạm.19 Nhìn chung, một khi con người đã xác định được những vấn đề như vậy, chúng sẽ không còn là những điều chưa biết là đã biết. Hoặc là họ sẽ tìm giải pháp để tạo ra dự đoán tốt, để vấn đề trở thành điều đã biết là đã biết và đòi hỏi con người và máy móc làm việc cùng nhau, hoặc họ không thể tìm được giải pháp và chúng sẽ trở thành những điều đã biết là chưa biết.
Sự dự đoán của máy có ảnh hưởng cực kỳ mạnh mẽ nhưng lại có những hạn chế. Nó không hoạt động tốt với lượng dữ liệu có hạn. Những người được đào tạo tốt có thể nhận ra những hạn chế này, cho dù là bởi những sự kiện hiếm hoi hay là do những vấn đề suy luận nhân quả, và cải thiện sự dự đoán của máy. Để làm được điều này, những người đó cần hiểu về máy.
Sự kết hợp cho dự đoán tốt hơn
Đôi khi, sự kết hợp giữa con người và máy móc tạo ra những kết quả dự đoán tốt nhất vì mỗi bên bổ sung cho khuyết điểm của nhau.
Vào năm 2016, nhóm chuyên gia nghiên cứu AI của Harvard/MIT chiến thắng Camelyon Grand Challenge, một cuộc thi phát triển máy phát hiện ung thư vú di căn từ những bộ phận sinh thiết. Thuật toán học sâu của nhóm chiến thắng đã dự đoán chính xác 92.5% so với nhà nghiên cứu bệnh lý học có xác suất dự đoán đúng 96.6%. Đây tuy có vẻ là một chiến thắng cho con người, nhưng những chuyên gia tiếp tục nghiên cứu và kết hợp thuật toán của họ cùng thuật toán của nhà nghiên cứu bệnh lý học. Kết quả là độ chính xác lên tới 99.5%.20 Tỉ lệ sai sót của con người giảm từ 3.4% xuống còn chỉ 0.5%. Tỉ lệ sai sót giảm đến 85%.
Đây là bài toán phân chia lao động kinh điển, nhưng không phải về mặt thể chất như Adam Smith đã mô tả. Thay vào đó, nó là sự phân chia lao động về mặt nhận thức mà chuyên gia kinh tế đồng thời là người tiên phong trong lĩnh vực máy tính Charles Babbage mô tả lần đầu ở thế kỷ 19: “Hiệu quả của sự phân chia lao động, cả trong quá trình cơ học và quá trình tinh thần là nó cho phép chúng ta mua cũng như áp dụng số lượng kĩ năng và kiến thức cần thiết cho nó.”21
Con người và máy móc đều làm tốt ở nhiều khía cạnh dự đoán khác nhau. Nhà nghiên cứu bệnh lý học nhìn chung thường đúng khi chẩn đoán bệnh ung thư. Tình huống mà con người nói rằng đó là căn bệnh ung thư nhưng lại bị nhầm lẫn là rất hiếm. Ngược lại, AI thường chính xác hơn khi nói rằng đó không phải là căn bệnh ung thư. Con người và máy mắc phải những sai sót khác nhau. Bằng việc nhận ra những khả năng khác nhau này, sự kết hợp giữa dự đoán của con người và máy sẽ vượt qua những yếu điểm này, từ đó nhanh chóng giảm tỉ lệ sai sót.
Vậy sự kết hợp này hoạt động ra sao trong môi trường doanh nghiệp? Sự dự đoán của máy có thể nâng cao năng suất dự đoán của con người thông qua hai con đường chính. Đầu tiên là bằng cách cung cấp một sự dự đoán ban đầu mà con người có thể sử dụng để kết hợp với những đánh giá của riêng họ. Thứ hai là bằng cách cung cấp ý kiến thứ hai sau một sự thật, hoặc sau một chỉ dẫn theo dõi. Với cách này, chủ doanh nghiệp có thể đảm bảo rằng con người làm việc chăm chỉ và đặt nỗ lực vào việc dự đoán. Nếu không theo dõi, con người có thể sẽ không làm việc chăm chỉ.
Một ví dụ tuyệt vời để kiểm tra sự tương tác như vậy là sự dự đoán liên quan đến khả năng thanh toán nợ của người nộp đơn xin vay. Daniel Paravisini và Antoinette Schoar tiến hành đánh giá một ngân hàng Colombia về những doanh nghiệp nhỏ nộp đơn vay sau khi có hệ thống tính điểm tín dụng mới.22 Hệ thống tính điểm vi tính hóa thu thập nhiều thông tin về những người nộp đơn và tổng hợp lại thành một đơn vị đo lường để dự đoán rủi ro. Sau đó ủy ban cho vay bao gồm nhân viên của ngân hàng sử dụng điểm và quá trình riêng của họ để phê duyệt, từ chối, hoặc giới thiệu khoản vay tới một người quản lý trong khu vực.
Một mẫu thử nghiệm ngẫu nhiên có đối chứng, không phải quy định quản lý, xác định liệu điểm số được giới thiệu trước hay sau quyết định. Do vậy, điểm số cung cấp một điểm tốt để đánh giá sự hiệu quả của quá trình đưa ra quyết định một cách khoa học. Một nhóm nhân viên được cung cấp số điểm ngay trước khi họ gặp khách hàng. Điều này tương tự với cách kết hợp con người với máy móc đầu tiên, trong đó sự dự đoán của máy móc ảnh hưởng đến quyết định của con người. Một nhóm nhân viên khác không được cung cấp số điểm trước khi họ đưa ra sự đánh giá đầu tiên. Điều này tương tự với cách kết hợp con người với máy móc thứ hai, sự dự đoán của máy giúp theo dõi chất
lượng quyết định của con người. Sự khác biệt giữa lần thứ nhất và lần thứ hai là liệu số điểm có cung cấp thông tin để con người đưa ra quyết định hay không.
Trong cả hai trường hợp, điểm số hoạt động hiệu quả, mặc dù sự cải thiện là lớn nhất khi điểm số được cung cấp trước. Trong trường hợp đó, ủy ban đưa ra những quyết định tốt hơn và yêu cầu người quản lý giúp đỡ ít hơn. Trong trường hợp khác, khi ủy ban có số điểm sau đó, quá trình đưa ra quyết định
cải thiện bởi vì sự dự đoán giúp những nhà quản lý cao cấp theo dõi những ủy ban. Nó gia tăng động lực cho ủy ban để đảm bảo chất lượng quyết định của họ.
Sự ghép cặp con người-máy dự đoán để tạo ra một sự dự đoán tốt hơn đòi hỏi sự hiểu rõ những hạn chế của con người và máy móc. Trong trường hợp của những ủy ban cho vay, con người có thể đưa ra sự dự đoán mang tính thiên vị hoặc họ có thể trốn tránh, trong khi máy móc có thể thiếu thông tin quan trọng. Trong khi chúng ta thường coi trọng tinh thần đồng đội khi con người hợp tác, chúng ta có thể không nghĩ đến sự ghép cặp con người-máy như là một đội. Để con người có thể giúp sự dự đoán của máy trở tốt hơn, hoặc ngược lại, điều quan trọng là hiểu rõ yếu điểm của con người và máy, sau đó kết hợp cả hai sao cho có thể vượt qua những yếu điểm.
Sự dự đoán ngoại lệ
Lợi ích lớn nhất của máy dự đoán là chúng có thể vượt qua con người. Một nhược điểm là chúng gặp khó khăn trong việc đưa ra sự dự đoán trong những trường hợp không phổ biến khi không có nhiều dữ liệu trong lịch sử. Kết hợp lại, điều này đồng nghĩa với việc nhiều sự kết hợp giữa con người-máy sẽ xảy ra dưới dạng “sự dự đoán ngoại lệ”.
Như chúng ta đã thảo luận, máy dự đoán học hỏi khi dữ liệu có nhiều, điều này xảy ra khi chúng đối mặt với nhiều quy luật hoặc viễn cảnh thường xuyên. Trong những tình huống này, máy dự đoán hoạt động mà không cần con người chú ý. Ngược lại, khi một yếu tố ngoại lệ phát sinh – một viễn cảnh không theo quy luật – nó nhờ đến sự giúp đỡ của con người, và sau đó con người đặt nhiều nỗ lực hơn để cải thiện và xác nhận sự dự đoán. “Sự dự đoán ngoại lệ” này chính xác là những gì xảy ra với ủy ban cho vay ở ngân hàng Colombia.
Ý tưởng về sự dự đoán ngoại lệ đã có tiền lệ trong kỹ thuật “quản lý ngoại lệ”. Khi đưa ra sự dự đoán, con người, trong nhiều khía cạnh, là người giám sát máy dự đoán. Người quản lý có nhiều công việc khó khăn; để tiết kiệm thời gian, và tạo ra mối quan hệ làm việc lý tưởng thì con người chỉ tập trung vào những gì thực sự cần thiết. Điều đó có nghĩa rằng con người có thể dễ dàng tận dụng những lợi ích của máy dự đoán trong những dự đoán theo quy luật.
Sự dự đoán ngoại lệ rất quan trọng với sản phẩm đầu tiên của Chisel. Sản phẩm đầu tiên của Chisel, điều mà chúng ta đã thảo luận ở đầu chương này, cần nhiều tài liệu khác nhau, nhiều thông tin đã được xác định và biên soạn bảo mật. Thủ tục tốn thời gian này phát sinh nhiều tình huống pháp lý như tài liệu có thể được tiết lộ cho những bên khác hoặc công khai, nhưng chỉ khi một số thông tin nhất định được ẩn đi.
Máy biên soạn của Chisel dựa vào sự dự đoán ngoại lệ thông qua việc duyệt sơ công việc đó.23 Cụ thể, một người dùng có thể thiết lập hiệu quả máy biên soạn sao cho mạnh hay yếu. Ngưỡng bị chặn của máy biên soạn mạnh có thể cao hơn phiên bản yếu hơn. Ví dụ, nếu bạn lo lắng về việc thông tin bảo mật
không được biên soạn, bạn có thể chọn mức độ mạnh. Nhưng nếu bạn lo lắng về việc tiết lộ quá ít thông tin, bạn có thể chọn mức độ yếu. Chisel cung cấp một giao diện dễ sử dụng cho người dùng để có thể kiểm tra lại những phần biên soạn và chấp nhận hoặc từ chối chúng. Nói cách khác, mỗi sự biên soạn đều là một đề xuất thay vì là một quyết định cuối cùng. Quyền hạn lớn nhất vẫn thuộc về con người.
Sản phẩm của Chisel kết hợp con người và máy để vượt qua những yếu điểm của cả hai. Máy hoạt động nhanh hơn con người và cung cấp sự đo lường nhất quán trên các tài liệu. Con người có thể can thiệp khi máy không có đủ dữ liệu để có thể đưa ra một sự dự đoán tốt hơn.
NHỮNG ĐIỂM CHÍNH
• Con người, bao gồm cả những chuyên gia chuyên nghiệp, có thể đưa ra những dự đoán không tốt dưới những điều kiện cụ thể. Con người thường chú trọng vào thông tin nổi bật và không tính đến những thuộc tính thống kê. Nhiều nghiên cứu khoa học ghi lại được những thiếu sót này trên nhiều ngành nghề. Hiện tượng này được minh họa trong bộ phim Moneyball.
• Máy móc và con người có những điểm mạnh và điểm yếu riêng tùy vào bối cảnh dự đoán. Khi máy dự đoán được cải thiện, các doanh nghiệp cần phải điều chỉnh, phân chia công việc giữa con người và máy móc. Máy dự đoán thường tốt hơn con người ở việc xác định những yếu tố trong những tương tác phức tạp, đặc biệt là trong những trường hợp có nhiều dữ liệu. Khi càng nhiều không gian cho những sự tương tác như vậy phát triển, khả năng con người đưa ra những dự đoán chính xác suy giảm, đặc biệt là tương quan với máy móc. Tuy nhiên, con người thường giỏi hơn máy trong việc hiểu quá trình tạo ra dữ liệu có ưu thế cho việc dự đoán, đặc biệt là trong những trường hợp ít dữ liệu. Chúng tôi mô tả sự phân loại trường hợp dự đoán (những điều đã biết là đã biết, những điều đã biết là chưa biết, những điều chưa biết là đã biết và những điều chưa biết là chưa biết) sẽ hữu ích trong việc phân chia lao động phù hợp.
• Máy dự đoán sẽ phát triển. Chi phí đơn vị cho mỗi dự đoán giảm khi tần suất tăng. Sự dự đoán của con người không phát triển theo cách như vậy. Tuy nhiên, con người có những mô hình nhận thức về cách thế giới hoạt động và do vậy có thể đưa ra dự đoán dựa vào lượng dữ liệu ít. Do vậy, chúng tôi mong chờ một sự gia tăng dự đoán ngoại lệ của con người mà ở đó máy tạo ra nhiều dự đoán nhất bởi chúng được dự đoán dựa trên quy luật, dữ liệu thông thường, nhưng khi những sự kiện hiếm có xảy ra, máy nhận ra nó không thể tự tin đưa ra dự đoán mà sẽ cần sự giúp đỡ của con người. Con người sẽ cung cấp sự dự đoán ngoại lệ.
PHẦN 2QUÁ TRÌNH ĐƯA RA QUYẾT ĐỊNH
7Mở ra những quyết định
C
húng ta thường liên hệ quá trình đưa ra quyết định với những quyết định lớn: Tôi có nên mua căn nhà này không? Tôi có nên học trường này không? Tôi có nên cưới người này không? Quả nhiên, những quyết định thay đổi cuộc đời này tuy ít nhưng rất quan trọng.
Nhưng chúng ta cũng luôn đưa ra những quyết định nhỏ: Tôi có nên tiếp tục ngồi trên chiếc ghế này không? Tôi có nên tiếp tục đi xuống con đường này không? Tôi có nên tiếp tục trả tiền hoá đơn tháng này không? Và giống như lời ca về ý chí tự do của ban nhạc rock Rush vĩ đại từ Canada: “Nếu bạn chọn
không đưa quyết định, thì bạn vẫn đã đưa ra lựa chọn.” Chúng ta xử lý nhiều quyết định nhỏ một cách tự động, có lẽ bằng việc mặc định chấp nhận và lựa chọn tập trung tất cả sự chú ý vào những quyết định lớn. Tuy nhiên, quyết định không lựa chọn cũng là một quyết định.
Quá trình đưa ra quyết định là cốt lõi của hầu hết các nghề nghiệp. Giáo viên quyết định cách giáo dục học sinh của họ, những đứa trẻ có tính cách và cách học khác nhau. Những người quản lý quyết định tuyển ai vào đội của họ và ai cần được thăng chức. Những người làm tạp vụ quyết định cách xử lý những
sự kiện bất ngờ như sự cố tràn nước và những điều kiện an toàn trong nguy hiểm tiềm tàng. Những người lái xe quyết định cách phản ứng với những tuyến đường bị chặn và tai nạn giao thông. Cảnh sát quyết định cách xử lý những cá nhân đáng ngờ và những tình huống có khả năng nguy hiểm. Các bác sĩ quyết định loại thuốc nào để kê đơn và khi nào cần thực hiện những bài kiểm tra đắt đỏ. Bố mẹ quyết định thời lượng xem TV phù hợp với con của họ.
Những quyết định như vậy thường xảy ra dưới những điều kiện không chắc chắn. Giáo viên không biết chắc liệu một đứa trẻ cụ thể nào đó sẽ học tốt hơn nhờ cách tiếp cận giảng dạy này hay cách tiếp cận khác. Người quản lý không biết chắc liệu một ứng viên nộp đơn xin việc có thể hiện tốt hay không. Bác sĩ không biết chắc liệu có cần phải tiến hành một xét nghiệm đắt đỏ hay không. Họ đều cần dự đoán.
Nhưng sự dự đoán không phải là một quyết định. Đưa ra quyết định đòi hỏi áp dụng sự đánh giá một dự đoán và rồi thực hiện. Trước khi có những sự tiến bộ gần đây trong trí tuệ nhân tạo, sự khác biệt này chỉ đơn thuần là sự quan tâm về mặt học thuật bởi vì con người luôn thực hiện dự đoán và đánh giá cùng lúc. Hiện giờ, những sự tiến bộ trong dự đoán bởi máy móc đồng nghĩa với việc chúng ta cần phải xác định cấu trúc của một quyết định.
Cấu trúc của một quyết định
Máy dự đoán sẽ có tác động tức thời ở giai đoạn quyết định. Nhưng sự quyết định có sáu yếu tố quan trọng khác (xem hình 7-1). Khi một người (hoặc một vật) đưa ra quyết định, họ sẽ nhận vào thông tin đầu vào từ thế giới quan cho phép sự dự đoán đó xảy ra. Sự dự đoán đó là có thể vì đã có sự đào tạo về
mối quan hệ giữa các loại dữ liệu khác nhau và loại dữ liệu nào liên quan gần nhất với tình huống. Kết hợp dự đoán cùng với sự đánh giá những vấn đề quan trọng, người quyết định có thể lựa chọn hành động. Hành động dẫn đến một kết quả (thường có một thành tựu liên quan nào đó hoặc sự trả giá). Kết quả là hệ quả của quyết định. Nó là yếu tố cần thiết để có thể cung cấp một bức tranh hoàn chỉnh. Kết quả cũng có thể cung cấp phản hồi để giúp cải thiện sự dự đoán tiếp theo.
Hãy tưởng tượng bạn bị đau chân và đến gặp bác sĩ. Bác sĩ gặp bạn, chụp X quang, xét nghiệm máu, hỏi bạn một vài câu hỏi và thu được thông tin đầu vào. Sử dụng thông tin đó, đồng thời dựa vào những năm kinh nghiệm ở trường y và những bệnh nhân có thể giống hoặc không giống bạn (đó là đào tạo và phản hồi), bác sĩ sẽ đưa ra chẩn đoán: “Bạn có khả năng là bị chuột rút cơ bắp, tuy nhiên cũng có khả năng là bạn bị tụ máu.”
Cùng với quá trình này là sự đánh giá. Đánh giá của bác sĩ sẽ dựa vào những yếu tố dữ liệu khác (bao gồm trực giác và kinh nghiệm). Giả sử nếu đó là chuột rút cơ bắp, vậy thì phương pháp điều trị là nghỉ ngơi. Nếu là tụ máu, thì phương pháp điều trị sẽ là thuốc không có tác dụng phụ lâu dài, nhưng có thể gây ra những sự khó chịu cho nhiều người. Nếu bác sĩ điều trị nhầm cơ bắp bị chuột rút của bạn thành tụ máu, vậy thì bạn sẽ cảm thấy không thoải mái trong một khoảng thời gian ngắn. Nếu bác sĩ điều trị tụ máu bằng việc nghỉ ngơi, vậy thì rất có thể sẽ có những biến chứng nguy hiểm hoặc thậm chí là tử
vong. Sự đánh giá bao gồm việc xác định những sự trả giá liên quan đến mỗi kết quả khả thi, bao gồm cả những kết quả liên quan đến những quyết định “đúng đắn” và những sai sót (trong trường hợp này, sự trả giá liên quan đến việc chữa bệnh, sự khó chịu, và những biến chứng nghiêm trọng). Xác định sự trả giá cho tất cả những kết quả khả thi là bước quan trọng trong việc quyết định khi nào nên chọn phương pháp điều trị bằng thuốc, sự khó chịu vừa phải và giảm nguy cơ biến chứng nguy hiểm, với khi nào nên chọn việc nghỉ ngơi. Vậy nên, khi đánh giá sự dự đoán, bác sĩ đưa ra quyết định, có lẽ dựa vào tuổi của bạn và ưu tiên rủi ro, bạn nên theo phương pháp điều trị chuột rút cơ bắp, ngay cả khi có khả năng thấp là bạn bị bệnh tụ máu. Cuối cùng là hành động điều trị và quan sát kết quả: Liệu cơn đau ở chân bạn có hết không? Liệu có những biến chứng khác phát sinh không? Bác sĩ có thể sử dụng kết quả quan sát là phản hồi để thông báo cho dự đoán tiếp theo.
Bằng việc chia nhỏ một quyết định thành nhiều yếu tố, chúng ta có thể đánh giá hoạt động nào của con người sẽ suy giảm giá trị và hoạt động nào sẽ tăng bởi sự dự đoán tốt hơn của máy móc. Đặc biệt, đối với bản thân sự dự đoán, máy dự đoán nhìn chung là sự thay thế tốt hơn cho sự dự đoán của con người. Khi sự dự đoán của máy càng thay thế nhiều sự dự đoán của con người, giá trị của sự dự đoán của con người sẽ suy giảm. Nhưng điểm chính là, trong khi sự dự đoán là thành phần quan trọng của bất kỳ quyết định nào, nó không phải yếu tố duy nhất. Những yếu tố khác của sự quyết định – sự đánh giá, dữ liệu và sự hành động – cho đến lúc này vẫn đang tồn tại trong tầm tay của con người. Chúng chính là sự bổ sung cho sự dự đoán, đồng nghĩa với việc chúng sẽ tăng giá trị nếu như sự dự đoán có giá thành rẻ. Ví dụ, chúng ta có thể sẽ nỗ lực hơn khi áp dụng sự đánh giá vào những quyết định mà chúng ta trước đó đã quyết định là không quyết định (ví dụ chấp nhận sự mặc định) bởi vì máy dự đoán hiện giờ cung cấp sự dự đoán tốt hơn, nhanh hơn và có giá thành rẻ hơn. Trong trường hợp đó, nhu cầu cho sự đánh giá của con người sẽ gia tăng.
Mất kiến thức
“The Knowledge” là chủ đề của một cuộc thử nghiệm mà những người lái xe London thực hiện để lái những chiếc taxi đen nổi tiếng của thành phố. Cuộc thử nghiệm bao gồm biết vị trí của hàng ngàn điểm và con đường khắp thành phố và – đây là phần khó nhất – dự đoán con đường ngắn nhất hoặc nhanh
nhất giữa hai điểm trong một thời điểm bất kỳ trong ngày. Lượng thông tin của một thành phố bình thường đã rất đáng kinh ngạc, nhưng London không phải là một thành phố bình thường. Nó là một quần thể của những ngôi làng và thị trấn độc lập cùng nhau phát triển trong suốt 2.000 năm để trở thành một đô thị toàn cầu.
Để vượt qua cuộc thử nghiệm này, những tài xế tiềm năng cần một điểm số gần như hoàn hảo. Không ngạc nhiên khi để đậu cuộc thử nghiệm này, những người lái xe mất trung bình ba năm, bao gồm thời gian không những tìm bản đồ mà còn lái xe quanh thành phố trên những xe gắn máy để ghi nhớ và hình dung. Nhưng một khi họ hoàn thành cuộc thử nghiệm này, huy chương xanh danh dự cũng được coi là một loại kiến thức.1
Bạn biết câu chuyện này sẽ đi đến đâu. Một thập kỷ trước, kiến thức của tài xế taxi Lonbon chính là lợi thế cạnh tranh của họ. Không ai có thể cung cấp mức độ dịch vụ tương tự. Những ai đáng lẽ sẽ đi bộ đều đi xe taxi chỉ vì những người lái xe biết đường. Nhưng chỉ năm năm sau, một thiết bị di động đơn giản gọi là GPS - hay hệ thống điều hướng vệ tinh - đã cho những người lái xe truy cập vào dữ liệu và những sự dự đoán từng là siêu năng lực của những người lái xe. Ngày nay, siêu năng lực tương tự có sẵn trên hầu hết các điện thoại. Mọi người sẽ không bị lạc. Mọi người biết tuyến đường nhanh nhất. Và giờ điện thoại thậm chí còn tốt hơn vì nó được cập nhật trong thời gian thực với thông tin giao thông.
Những người lái xe từng đầu tư ba năm nghiên cứu để học “The Knowledge” không biết rằng một ngày họ sẽ phải cạnh tranh với máy dự đoán. Qua năm tháng, họ lưu giữ hình ảnh bản đồ vào trí nhớ, những tuyến đường được kiểm tra thực nghiệm và điền vào chỗ trống những kiến thức chung của họ. Hiện giờ, những ứng dụng điều hướng có quyền truy cập vào cùng loại dữ liệu bản đồ và có thể, thông qua sự kết hợp của các thuật toán và đào tạo dự đoán, tìm được tuyến đường tốt nhất khi được yêu cầu, thông qua dữ liệu giao thông trong thời gian thực mà người lái xe khó lòng biết được.
Nhưng số phận của những người lái xe taxi không chỉ dựa vào khả năng dự đoán “The Knowledge” của các ứng dụng mà còn dựa vào những yếu tố quan trọng khác để chọn con đường tốt nhất từ điểm A đến điểm B. Đầu tiên, những người lái xe taxi có thể điều khiển xe. Thứ hai, họ có những cảm biến
- mắt và tai của họ – có thể đưa những dữ liệu ngắn gọn tới não bộ của họ để đảm bảo rằng họ sử dụng kiến thức của mình một cách tốt nhất. Nhưng những người khác cũng làm vậy. Không có tài xế taxi London nào trở nên tệ hơn trong công việc vì những ứng dụng điều hướng. Thay vào đó, hàng triệu người không phải là lái xe taxi trở nên tốt hơn nhiều. Kiến thức của người lái xe taxi không còn là nguồn hàng hiếm nữa, điều này dẫn đến những nền tảng đi chung xe như Uber.
Những người lái xe khác sử dụng “The Knowledge” với điện thoại và dự đoán tuyến đường nhanh nhất đồng nghĩa với việc họ có thể cung cấp những dịch vụ tương tự. Khi sự dự đoán chất lượng cao của máy có giá thành rẻ, sự dự đoán của con người sụt giảm giá trị, nên những người lái xe cũng gánh chịu hậu quả. Số lượt đi taxi đen ở London sụt giảm. Thay vào đó, những người còn lại cung cấp dịch vụ tương tự. Những người này còn có kĩ năng lái xe và những giác quan của con người, những tài sản bổ sung có giá trị tăng cao khi sự dự đoán có giá thành rẻ.
Đương nhiên, những chiếc xe tự lái có thể sẽ thay thế những kĩ năng và giác quan này, nhưng chúng ta sẽ trở lại với câu chuyện đó sau. Quan điểm của chúng tôi ở đây là để hiểu rõ sức ảnh hưởng từ sự dự đoán của máy đòi hỏi phải hiểu rõ nhiều khía cạnh khác nhau của quyết định, như được mô tả ở phần cấu trúc của một quyết định.
Bạn có nên cầm ô theo không?
Cho đến bây giờ, chúng ta vẫn chưa đưa ra định nghĩ thực sự chính xác về sự đánh giá. Để giải thích nó, chúng tôi giới thiệu công cụ giúp đưa ra quyết định: cây quyết định.2 Nó đặc biệt hữu ích cho những quyết định không chắc chắn, khi bạn không chắc về việc gì sẽ xảy ra nếu bạn thực hiện một sự lựa chọn cụ thể.
Hãy xem xét một sự lựa chọn quen thuộc mà bạn có thể đối mặt. Bạn có nên cầm theo ô khi đi bộ không? Bạn có thể nghĩ rằng ô là thứ bạn che trên đầu để không dính ướt và bạn đã đúng. Nhưng chiếc ô cũng là một hình thức bảo hiểm, trong trường hợp này, chống lại khả năng mưa. Vậy nên, khuôn mẫu sau đây ứng dụng cho bất kỳ hình thức bảo hiểm nào liên quan đến quyết định để giảm thiểu rủi ro.
Rõ ràng, nếu bạn biết rằng trời sẽ không mưa, bạn sẽ để ô ở nhà. Mặt khác, nếu bạn biết là trời sẽ mưa, thì bạn sẽ chắc chắn mang nó theo cùng. Trong hình 7-2, chúng tôi thể hiện điều này bằng cách sử dụng một biểu đồ giống hình cái cây. Ở gốc cây là hai nhánh thể hiện những sự lựa chọn bạn có thể đưa ra: “mang ô” hoặc “để ô ở nhà”. Mở rộng từ đó là hai nhánh thể hiện việc
bạn không chắc chắn: “mưa” với “nắng”. Nếu không có dự báo thời tiết tốt, bạn không thể biết chắc. Bạn có thể biết rằng, ở thời điểm này năm ngoái, khả năng nắng cao gấp ba lần khả năng mưa. Điều này sẽ cho bạn 1/3 khả năng nắng và 1/4 khả năng mưa. Đây là sự dự đoán của bạn. Cuối cùng, ở ngọn các nhánh là những hệ quả. Nếu bạn không mang theo ô và trời mưa, bạn sẽ bị ướt…
Bạn nên đưa ra quyết định gì? Đây là giai đoạn mà sự đánh giá bắt đầu xuất hiện. Sự đánh giá là quá trình xác định thành quả của một hành động cụ thể trong một môi trường cụ thể. Đó là về việc thực hiện được mục tiêu bạn thực sự theo đuổi. Sự đánh giá bao gồm xác định điều chúng ta gọi là “chức năng thành quả”, những thành quả tương ứng, những sự trả giá liên quan đến việc thực hiện những hành động cụ thể và cho ra những kết quả cụ thể. Bị ướt hay không? Có nên mất công mang theo ô hay không?
Hãy giả sử bạn thích không bị ướt và không muốn mang theo ô (bạn đánh giá nó 10 trên 10) hơn là việc không bị ướt mà phải mang theo ô (8 trên 10) hơn là việc bị ướt (một con số 0 tròn trĩnh). (Xem hình 7-3). Điều đó đủ khiến bạn hành động. Với sự dự đoán khả năng mưa 1/4 và đánh giá những sự trả giá cho việc bị ướt hoặc mang theo ô, bạn có thể tính toán được sự trả giá trung bình của bạn giữa việc mang và không mang ô. Dựa vào đó, tốt hơn là bạn nên mang ô (sự trả giá trung bình là 8) hơn là không mang nó (sự trả giá trung bình là 7.5).3 Nếu bạn thực sự ghét việc mang theo ô (6 trên 10), sự đánh giá của bạn về độ ưu tiên có thể được xem xét. Trong trường hợp này, sự trả giá trung bình cho việc để ô ở nhà là không đổi (7.5), trong khi sự trả giá cho việc mang theo ô lúc này là 6. Vậy nên, những người không thích ô sẽ để ô của họ ở nhà.
Ví dụ này rất đỗi bình thường: đương nhiên, ai mà không thích ô hơn cả việc bị ướt thì sẽ để ô ở nhà. Nhưng cây quyết định là một công cụ hữu ích cho việc xác định những sự trả giá cho những quyết định không hề bình thường, đó chính là cốt lõi của sự đánh giá. Ở đây, hành động là mang theo ô, sự dự đoán là mưa hay nắng, kết quả là liệu bạn có bị ướt hay không, và sự đánh giá dự đoán niềm hạnh phúc mà bạn sẽ cảm thấy (“sự trả giá”) từ việc bị ướt hay không, mang hay không mang theo ô. Khi sự dự đoán trở nên tốt hơn, nhanh hơn và có giá thành rẻ hơn, chúng ta sẽ sử dụng chúng nhiều hơn để đưa ra nhiều quyết định hơn, vậy nên chúng ta cũng sẽ cần nhiều sự đánh giá của con người hơn và do vậy, giá trị của sự đánh giá từ con người sẽ tăng lên.
NHỮNG ĐIỂM CHÍNH
• Máy dự đoán rất có giá trị bởi vì (1) chúng có thể thường xuyên cho ra những sự dự đoán tốt hơn, nhanh hơn và có giá thành rẻ hơn so với con người; (2) sự dự đoán là yếu tố quan trọng trong quá trình đưa ra quyết định không chắc chắn; và (3) quá trình đưa ra quyết định phổ biến ở khắp mọi nơi trong cuộc sống kinh tế và xã hội của chúng ta. Tuy nhiên, sự dự đoán không phải là một quyết định – nó chỉ là một thành phần của sự quyết định. Những thành phần khác bao gồm sự đánh giá, hành động, kết quả và ba loại dữ liệu (dữ liệu đầu vào, dữ liệu đào tạo và dữ liệu phản hồi).
• Bằng việc chia nhỏ một quyết định ra thành nhiều thành phần như vậy, chúng ta có thể hiểu ảnh hưởng của máy dự đoán tới giá trị của con người và những tài sản khác. Tuy nhiên, giá trị của những sự bổ sung, ví dụ như những kỹ năng của con người liên quan đến thu thập dữ liệu, sự đánh giá và hành động, sẽ càng trở nên có giá trị. Trong trường hợp của những lái xe taxi London đã đầu tư ba năm để học “The Knowledge” – cách dự đoán tuyến đường nhanh nhất từ địa điểm này đến địa điểm khác ở một thời điểm bất kỳ trong ngày – không ai làm tệ hơn cả vì nhờ có máy dự đoán. Thay vào đó, rất nhiều người lái xe khác trở nên giỏi hơn trong việc chọn tuyến đường tốt nhất bằng việc sử dụng máy dự đoán. Những kỹ năng dự đoán của những người lái xe taxi không còn là một mặt hàng khan hiếm nữa.
• Sự đánh giá bao gồm việc xác định sự trả giá tương quan đối với mỗi kết quả khả thi của quyết định, bao gồm những quyết định “đúng đắn” cũng như những sai sót. Sự đánh giá đòi hỏi xác định cụ thể mục tiêu bạn đang thực sự theo đuổi và là bước quan trọng trong quá trình đưa ra quyết định. Khi máy
dự đoán đưa ra những dự đoán tốt hơn, nhanh hơn và có giá thành rẻ hơn, giá trị từ sự đánh giá của con người sẽ tăng vì chúng ta cần nhiều hơn nữa. Chúng ta có thể sẽ sẵn sàng nỗ lực và áp dụng sự đánh giá vào những quyết định mà trước đây chúng ta lựa chọn không quyết định (bằng việc chấp nhận sự mặc định).
8Giá trị của sự đánh giá
V
iệc có sự dự đoán tốt hơn làm tăng giá trị của sự đánh giá. Dù sao thì, nó cũng không biết được khả năng trời mưa nếu bạn không biết bản thân muốn khô ráo hoặc ghét việc mang theo ô đến mức nào. Máy dự đoán không cung cấp sự đánh giá. Chỉ có con người mới làm vậy, bởi vì chỉ có con người có thể diễn đạt những kết quả từ việc thực hiện những hành động khác nhau. Khi AI tiếp quản việc dự đoán, con người sẽ ít thực hiện quy trình kết hợp dự đoán-đánh giá khi đưa ra quyết định hơn và tập trung vào vai trò đánh giá. Điều này sẽ cho phép một giao diện tương tác giữa sự dự đoán của máy và sự đánh giá của con người, giống như cách bạn thực hiện những truy vấn thay thế khi tương tác với một bảng tính hoặc cơ sở dữ liệu.
Sự dự đoán tốt hơn mang đến nhiều cơ hội để cân nhắc những thành tựu của nhiều hành động khác nhau – nói cách khác, nhiều cơ hội cho sự đánh giá hơn. Và điều đó đồng nghĩa rằng sự dự đoán càng tốt hơn, nhanh hơn và có giá thành rẻ hơn sẽ cho chúng ta thực hiện nhiều quyết định hơn.
Đánh giá lừa đảo
Mạng lưới thẻ tín dụng ví dụ như Mastercard, Visa và American Express dự đoán và đánh giá mọi lúc. Họ phải dự đoán liệu những ứng viên nộp thẻ có đáp ứng đủ tiêu chuẩn của họ cho khả năng thanh toán nợ hay không. Nếu một cá nhân không thể đáp ứng, công ty sẽ từ chối thẻ tín dụng của họ. Bạn có thể nghĩ rằng đó chỉ là dự đoán đơn thuần, nhưng một yếu tố quan trọng của sự đánh giá cũng được bao gồm. Khả năng thanh toán nợ là một thang trượt, và công ty thẻ tín dụng cần phải quyết định độ rủi ro họ sẵn sàng chịu với mức lãi suất và mặc định khác nhau. Những quyết định này dẫn đến những mô hình kinh doanh khác nhau – sự khác biệt giữa thẻ bạch kim cao cấp của American Express và thẻ ở mức độ cơ bản dành cho sinh viên đại học.
Công ty cũng cần dự đoán liệu một giao dịch nào đó có hợp pháp hay không. Giống như quyết định của bạn về việc có nên mang theo ô hay không, công ty cần phải cân nhắc bốn kết quả khác nhau (hình 8-1).
Công ty cần phải dự đoán liệu một khoản phí là lừa đảo hay hợp pháp, sau đó quyết định nên cho phép hay từ chối giao dịch và rồi đánh giá mỗi kết quả (từ chối một khoản phí lừa đảo là việc làm tốt, nhưng khiến khách hàng tức giận với việc từ chối một giao dịch hợp pháp là việc làm không tốt). Nếu các công ty thẻ tín dụng hoàn hảo trong việc dự đoán lừa đảo, tất cả sẽ ổn thoả. Nhưng
họ lại không như vậy. Ví dụ, công ty thẻ tín dụng của Joshua (một trong những tác giả) từ chối những giao dịch khi anh ấy mua sắm giày chạy theo định kỳ, đôi khi anh ấy mua mỗi năm một lần, thông thường là ở trung tâm mua sắm khi anh ấy đi nghỉ. Trong nhiều năm, anh ấy phải gọi đến công ty thẻ tín dụng để bỏ sự hạn chế đó.
Trộm cắp thẻ tín dụng thường xảy ra ở những trung tâm thương mại, và một vài mua sắm lừa đảo đầu tiên có thể sẽ là những thứ như giày và quần áo (dễ dàng để đổi thành tiền mặt khi trả lại hàng ở một chi nhánh khác cùng chuỗi). Và từ khi Joshua không còn thường xuyên mua quần áo và giày và ít khi đến trung tâm mua sắm, công ty thẻ tín dụng dự đoán rằng thẻ có khả năng bị đánh cắp. Đó là một sự dự đoán hợp lý.
Một vài yếu tố ảnh hưởng đến việc dự đoán liệu một chiếc thẻ có bị đánh cắp hay không bao gồm những yếu tố khái quát (loại giao dịch, ví dụ như mua giày chạy), và những yếu tố khác cụ thể hơn đối với mỗi cá nhân (trong trường hợp này, độ tuổi và tần suất). Sự kết hợp đó đồng nghĩa với việc thuật toán ngăn chặn những giao dịch sẽ rất phức tạp.
Lời hứa của AI là nó có thể đưa ra dự đoán chính xác hơn, đặc biệt trong những tình huống có sự kết hợp giữa những thông tin khái quát và thông tin cá nhân hóa. Ví dụ, nếu có dữ liệu về những năm giao dịch của Joshua (một trong những tác giả), máy dự đoán có thể học những mẫu của các giao dịch, bao gồm sự thật rằng anh ấy mua giày vào thời điểm tương tự mỗi năm. Thay vì phân loại sự mua sắm đó là sự kiện bất thường, nó có thể phân loại sự mua sắm đó là sự kiện bình thường cho một người cụ thể. Máy dự đoán có thể nhận ra những mối tương quan khác, ví dụ như mất bao nhiêu thời gian để một người mua sắm xong, tìm hiểu rằng liệu những giao dịch trong hai cửa hàng khác nhau có quá gần nhau không. Khi máy dự đoán trở nên chính xác hơn trong việc ngăn chặn những giao dịch, mạng lưới thẻ có thể trở nên tự tin
hơn khi áp đặt một hạn chế và thậm chí là liệu có nên liên lạc với khách hàng hay không. Điều này đã xảy ra. Lần mua sắm giày chạy cuối cùng của Joshua ở trung tâm mua sắm diễn ra suôn sẻ.
Nhưng cho đến khi máy dự đoán trở nên hoàn hảo trong việc dự đoán gian lận, những công ty thẻ tín dụng sẽ phải tìm ra chi phí của sai sót, điều mà đòi hỏi sự đánh giá. Giả sử sự dự đoán đó không hoàn hảo và có khả năng 10% là không chính xác. Vậy nếu những công ty từ chối giao dịch, họ đã đưa ra quyết định đúng với 90% khả năng và tiết kiệm cho mạng lưới chi phí khôi phục thanh toán liên quan đến giao dịch trái phép. Nhưng đồng thời họ cũng từ chối một giao dịch hợp pháp với 10% khả năng, để lại cho mạng lưới một lượng khách hàng không hài lòng. Để tìm ra hành động đúng đắn, họ cần có khả năng cân bằng chi phí liên quan đến phát hiện lừa đảo với chi phí liên quan đến sự không hài lòng của khách hàng. Những công ty thẻ tín dụng không tự động biết được câu trả lời đúng cho sự đánh đổi này. Họ cần tìm ra câu trả lời đó. Sự đánh giá là quá trình thực hiện việc đó. Trong trường hợp này, bởi vì khả năng giao dịch lừa đảo thường gấp chín lần so với khả năng giao dịch hợp pháp, công ty sẽ từ chối khoản phí trừ khi sự hài lòng của khác hàng quan trọng gấp chín lần so với tổn thất.
Với lừa đảo tín dụng, có rất nhiều sự trả giá có thể dễ dàng đánh giá. Khả năng cao là chi phí khôi phục có giá trị rõ ràng mà mạng lưới có thể xác định. Giả sử cho mỗi giao dịch 100 đô, chi phí khôi phục là 20 đô. Nếu chi phí cho sự không hài lòng của khách hàng ít hơn 180 đô, việc từ chối giao dịch là hợp lý (10% của 180 đô là 18 đô, bằng với 90% của 20 đô).
Lừa đảo thẻ tín dụng cũng là một quá trình đưa ra quyết định được định nghĩa rõ ràng, đó là một lý do khiến chúng tôi quay trở lại với nó, nhưng nó vẫn rất phức tạp. Ngược lại, với những quyết định khác, không chỉ có những hành động tiềm năng trở nên phức tạp hơn (không chỉ đơn thuần là sự chấp nhận hay từ chối), mà những tình huống tiềm năng (hoặc trạng thái) cũng thay đổi. Sự đánh giá đòi hỏi sự hiểu biết về kết quả của mỗi cặp hành động và tình huống. Ví dụ về thẻ tín dụng của chúng tôi chỉ có bốn kết quả (hoặc tám nếu bạn phân biệt được giữa những khách hàng có giá trị tài sản ròng lớn và những người khác). Nhưng nếu bạn có 10 hành động và 20 tình huống có thể xảy ra, vậy thì bạn sẽ phải đánh giá 200 kết quả. Khi mọi thứ trở nên phức tạp hơn, số lượng kết quả có thể trở nên áp đảo.
Các chi phí nhận thức của sự đánh giá
Những ai đã nghiên cứu về sự quyết định trong quá khứ thường cho rằng kết quả là những thứ có sẵn – chúng tồn tại. Bạn có thể thích kem sôcôla, trong khi bạn của bạn có thể thích kem gelato xoài. Việc hai người có những quan
điểm khác nhau như vậy không để lại nhiều hậu quả. Tương tự, chúng tôi giả sử rằng đa số các doanh nghiệp đều tối đa hóa lợi nhuận hoặc giá trị cổ đông. Những chuyên gia kinh tế nghiên cứu lý do tại sao các công ty lựa chọn những mức giá nhất định cho sản phẩm của họ đã thấy rằng việc thực hiện những mục tiêu đó bằng niềm tin là rất hữu ích.
Sự trả giá hiếm khi rõ ràng, và quá trình để hiểu những sự trả giá có thể rất tốn thời gian cũng như tiền bạc. Tuy nhiên, sự phát triển của máy dự đoán đã giúp hiểu được logic và động lực cho những giá trị trả giá này.
Về mặt kinh tế, chi phí của việc xác định những sự trả giá chủ yếu sẽ là thời gian. Hãy xem xét một lộ trình cụ thể mà nhờ đó bạn có thể xác định những sự trả giá: cân nhắc và suy nghĩ. Hãy suy nghĩ điều bạn thực sự muốn đạt được hoặc chi phí cho sự không hài lòng của khách hàng có thể sẽ ra sao. Hãy dành thời gian để suy nghĩ, đối chiếu và có thể là hỏi lời khuyên của người khác. Hoặc có thể là dành thời gian nghiên cứu để hiểu rõ hơn về những sự trả giá.
Đối với việc phát hiện lừa đảo thẻ tín dụng, việc nghĩ về sự trả giá cho những khách hàng hài lòng hoặc không hài lòng và chi phí của việc cho phép một giao dịch lừa đảo được tiến hành là những bước đầu tiên rất cần thiết. Cung cấp những sự trả giá khác nhau cho những khách hàng có giá trị tài sản ròng lớn đòi hỏi nhiều sự suy nghĩ hơn. Việc đánh giá liệu những sự trả giá này có thay đổi khi những khách hàng đó trong kỳ nghỉ hay không, đòi hỏi sự cân nhắc kỹ lưỡng hơn. Vậy còn những khách hàng bình thường đang đi nghỉ thì sao? Sự trả giá trong những tình huống đó liệu có khác? Và có đáng để tách biệt việc du lịch trong chuyến công tác và kỳ nghỉ không? Hay những chuyến đi tới thành phố Rome từ Grand Canyon?
Trong mỗi trường hợp, việc đánh giá sự trả giá đòi hỏi thời gian và công sức: nhiều kết quả hơn đồng nghĩa với nhiều sự đánh giá hơn, đồng thời tốn nhiều thời gian và công sức hơn. Con người trải qua những chi phí nhận thức của sự đánh giá như là một quá trình đưa ra quyết định chậm. Chúng ta đều cần phải
quyết định chúng ta muốn trả giá bao nhiêu cho chi phí của sự trì hoãn quyết định. Một vài người sẽ chọn không nghiên cứu sâu những sự trả giá cho những bối cảnh có vẻ xa xôi hoặc ít có khả năng xảy ra. Mạng lưới thẻ tín dụng có thể sẽ thấy đáng để tách biệt việc du lịch trong chuyến đi công tác và kỳ nghỉ nhưng không phải là những kỳ nghỉ từ Grand Canyon đến thành phố Rome.
Trong những tình huống không khả thi như vậy, mạng lưới thẻ có thể sẽ đoán những quyết định chính xác, gộp vài thứ vào cùng với nhau, hoặc đơn giản là chọn một mặc định an toàn hơn. Nhưng với những quyết định thường xuyên hơn (ví dụ như việc đi du lịch nói chung) hoặc những điều có vẻ quan trọng hơn (ví dụ như những khách hàng có giá trị tài sản ròng lớn), mạng lưới thẻ sẽ mất thời gian để cân nhắc và xác định những sự trả giá cẩn thận hơn. Nhưng nó càng tốn nhiều thời gian để thử nghiệm thì quá trình đưa ra quyết định sẽ càng mất nhiều thời gian để trở nên hoàn hảo.
Xác định những sự trả giá cũng giống như nếm thử đồ ăn mới: thử một cái gì đó và xem điều gì xảy ra. Hoặc, nói theo thuật ngữ của kinh doanh hiện đại: thử nghiệm. Mỗi cá nhân có thể thực hiện những hành động khác nhau trong
cùng một trường hợp và học được kết quả thực tế là gì. Họ học từ những sự trả giá thay vì nghĩ về chúng. Đương nhiên, bởi vì sự thử nghiệm đồng nghĩa với việc làm những gì mà bạn có thể sẽ coi là sai sót, những thử nghiệm cũng có chi phí. Bạn sẽ thử món ăn mà có thể bạn không thích. Nếu bạn tiếp tục thử những món ăn mới với hy vọng tìm được món gì đó lý tưởng, bạn đang bỏ lỡ nhiều bữa ăn ngon miệng. Sự đánh giá, cho dù là bằng sự cân nhắc hay sự thử nghiệm, đều tốn kém.
Biết lý do vì sao bạn làm những điều cụ thể
Sự dự đoán là cốt lõi của bước tiến đến với những chiếc xe tự lái, và sự phát triển của những nền tảng như Uber hay Lyft: lựa chọn tuyến đường giữa điểm đi và điểm đến. Những thiết bị điều hướng xe đã xuất hiện từ một vài thập kỷ, được xây dựng thành những chiếc xe hơi hoặc chỉ là những thiết bị độc lập. Nhưng sự phát triển của những thiết bị di động được kết nối Internet đã thay đổi dữ liệu mà phần mềm điều hướng của những nhà cung cấp nhận được. Ví dụ, trước khi sáp nhập vào Google, công ty khởi nghiệp Israel Waze đã tạo ra những bản đồ giao thông chính xác bằng việc theo dõi những tuyến đường mà người lái xe chọn. Sau đó nó sử dụng thông tin đó để cung cấp sự tối ưu
hóa hiệu quả về con đường nhanh nhất giữa hai điểm, dựa vào thông tin nó nhận được từ những người lái xe cũng như sự theo dõi liên tục giao thông. Nó cũng có thể dự đoán cách mà những điều kiện giao thông có thể tiếp diễn nếu bạn đi xa hơn, đồng thời có thể cung cấp những con đường mới và hiệu quả hơn trên tuyến đường nếu những điều kiện thay đổi. Những người dùng ứng dụng như Waze không phải lúc nào cũng làm theo chỉ dẫn. Họ không phản đối sự dự đoán, nhưng mục tiêu của họ có thể bao gồm nhiều yếu tố khác chứ không chỉ có mỗi tốc độ. Ví dụ, ứng dụng không biết người lái xe đang hết nhiên liệu và cần trạm xăng. Nhưng những người lái xe, biết rằng họ cần xăng, có thể bỏ qua sự gợi ý của ứng dụng và đi theo tuyến đường khác.
Tất nhiên là những ứng dụng như Waze có thể và sẽ trở nên tốt hơn. Ví dụ, như với xe Tesla chạy bằng điện thì sự điều hướng được dựa vào nhu cầu cần nạp điện và vị trí của những trạm điện. Một ứng dụng có thể chỉ đơn giản hỏi bạn liệu bạn có cần nhiên liệu hay không, hoặc trong tương lai, thậm chí có thể lấy dữ liệu trực tiếp từ xe của bạn. Điều này dường như là một vấn đề có thể giải quyết được, cũng giống như bạn có thể điều chỉnh cài đặt trong những ứng dụng điều hướng để tránh những đường có trạm thu phí.
Những yếu tố khác mà bạn ưa thích sẽ khó để lập trình hơn. Ví dụ, trên một đoạn đường dài, bạn có thể muốn đảm bảo rằng bạn đi qua những địa điểm phù hợp nhất định để nghỉ ngơi và ăn. Hoặc những tuyến đường nhanh nhưng chỉ tiết kiệm được 1-2 phút và thường rất tốn công khi lái. Hoặc bạn có thể không thích đi những con đường nhiều gió. Một lần nữa, những ứng dụng có thể sẽ học hỏi từ những hành vi, nhưng ở một thời điểm bất kỳ, một vài yếu tố sẽ không phải là một phần của sự dự đoán đã được mã hóa để tự động hóa một hành động. Máy móc có những hạn chế cơ bản về việc nó sẽ tốn bao nhiêu để có thể học cách dự đoán những sự ưu tiên của bạn.
Một điểm nhìn bao quát hơn cho những quyết định là những mục tiêu hiếm khi chỉ có một chiều. Con người sở hữu kiến thức, rõ ràng và hàm ẩn, về lý do họ làm một điều gì đó, điều đó có thể cho họ những cân nhắc cá nhân và chủ quan. Trong khi máy dự đoán điều gì có thể xảy ra, con người vẫn sẽ
quyết định thực hiện hành động dựa trên sự hiểu biết của họ về mục tiêu. Trong nhiều tình huống, như với Waze, máy sẽ cho con người một sự dự đoán ngụ ý một kết quả nhất định một chiều (ví dụ như tốc độ); con người sau đó sẽ quyết định có nên bỏ qua sự gợi ý hành động đó hay không. Dựa