🔙 Quay lại trang tải sách pdf ebook Nội Soi Google
Ebooks
Nhóm Zalo
https://thuviensach.vn
LỜI CẢM ƠN
Các nhân viên của Google đã làm hết sức có thể để dành thời gian giúp đỡ tôi. Mặc dù bản danh sách quả thực có thể lên tới hàng trăm người, nhưng tôi vẫn mạo muội xin được liệt kê ra đây một vài nhân vật đã bỏ không biết bao công sức giúp đỡ tôi hiểu rõ hơn về Google, đó là Paul Buchheit, Matt Cutts, David Drummond, Urs Hölzle, Bradley Horowitz, Kai-Fu Lee, Salar Kamangar, Joe Kraus, Andrew Maclaughlin, Marissa Mayer, Sundar Pichai, Andy Rubin, Amit Singhal, Hal Varian, và Susan Wojcicki. (Xin được gửi lời xin lỗi chân thành của tôi tới những người xứng đáng được nhắc tới mà tôi không thể nêu hết tên trong những trang sách này).
Xin gửi lời cảm ơn đặc biệt tới Karen Wickre, một nhân viên quan hệ công chúng được chỉ định làm “người chăn cừu”, hướng dẫn viên tốt nhất đưa tôi đến Google.
Những biên tập viên của Wired đều hiểu được rằng dự án về cuốn sách này của một nhân viên mới không phải là trò tiêu khiển tốn kém mà thực sự mang lại lợi ích. Vì vậy, cảm ơn Chris Anderson, Bob Cohn, Thomas Goetz, Mark Horowitz, Jason Tanz, và Mark McCluskey. Tôi cũng biết ơn sếp cũ của mình ở tạp chí Newsweek và những biên tập viên ở đó (đặc biệt là Mark Whitaker, George Hackett, và David Jefferson) vì đã cung cấp cho tôi nền tảng để nghiên cứu Google ngay từ buổi sơ khai.
Một người đã thực sự góp mặt vào tất cả các buổi phỏng vấn khi chép lại các cuộc hội thoại, Victoria Wright, giờ đây chắc hẳn phải là người có vốn kiến thức uyên bác nhất về Google, dù chưa từng đặt chân vào trụ sở của công ty. Suốt mùa xuân năm 2009, tôi đã nhận được sự giúp đỡ của Andrew Marantz, dưới sự bảo trợ của chương trình báo cáo giảng dạy văn học của trường Đại học New York. Zach Gottlieb đã giúp tôi nghiên cứu Google.org. Bạn tôi, Lynnea Johnson đã hỗ trợ tôi rất nhiều khi cho tôi mượn ngôi nhà ở Palo Alto mà cô ấy là đồng sở hữu cùng với Carolyn Rose làm căn cứ trong thời gian thực hiện dự án. Ngoài ra, để cuốn sách
https://thuviensach.vn
được hoàn thành nhanh chóng hơn, không thể không nhắc đến sự chu đáo của Erin Rooney Doland, người đã giúp tôi sắp xếp và dọn dẹp phòng làm việc. Đội ngũ kiểm tra tính xác thực thông tin của tôi bao gồm Deborah Branscum, Victoria Wright, Stacy Horn, Teresa Carpenter, và Andrew Levy. (Dẫu vậy, như thường lệ, trách nhiệm cuối cùng thuộc về tác giả.) Tôi nhận được sự hiểu biết và những lời khuyên bổ ích trong suốt quá trình viết sách từ phía John Markoff, Kevin Kelly, và Brad Stone. Độc giả đầu tiên và nhiệt thành nhất của tôi không ai khác, là vợ tôi, Teresa Carpenter. (Thật hữu dụng khi sống cùng nhà với một người đã từng giành giải thưởng Pulitzer.)
Và lúc nào cũng vậy, sự giúp đỡ của người đại diện Flip Brophy cũng thật vô giá ở mọi giai đoạn trong quá trình xuất bản đầy nguy nan. Ở Simon & Schuster, Bob Bender một lần nữa trở thành biên tập viên sắc sảo và tỉ mỉ của tôi, cùng với sự trợ giúp của Johanna Li. Người hiệu đính và sửa bản in ở Simon & Schuster là Nancy Inglis. David Rosenthal đã tin tưởng tôi ngay từ đầu.
Trên tất thảy, tác giả nào cũng phải cần sự giúp đỡ cũng như hi sinh của những người thân yêu, và tôi không phải là ngoại lệ. Gửi lời yêu thương và sự biết ơn sâu sắc nhất tới Teresa và Andrew.
Cuối cùng, cuốn sách này – cũng giống như hầu hết mọi tác phẩm báo chí phản ánh người thực việc thực khác được viết trong thế kỉ 21 – chắc chắn sẽ khó lòng có thể hoàn thành được nếu không có cỗ máy tìm kiếm Google. Cảm ơn Larry, Sergey và tất cả các kỹ sư, những người đã tạo ra và cải tiến công cụ tuyệt diệu đầy tính công nghệ và văn hóa này!
https://thuviensach.vn
MỞ ÐẦU
TÌM KIẾM GOOGLE
“Bạn đã từng nghe nói về Google?”
Năm 2007, vào một ngày tháng 7 vô cùng nóng nực, tại một làng quê vùng nông thôn Ragihalli của Ấn Độ, cách thành phố Bangalore 30 dặm. 22 người từ một công ty có trụ sở ở Mountain View, California, lái mấy chiếc xe SUV và đi theo một con đường mòn dẫn tới địa bàn của 70 căn lều quân sự xơ xác với sàn đổ bê tông, bao quanh là những cánh đồng thi thoảng lại bị giày xéo bởi lũ voi không mời mà tới. Dù mấy năm gần đây điện đã về đến Ragihalli nhưng trong cộng đồng này không có lấy một chiếc máy tính cá nhân nào. Cuộc viếng thăm đã bắt đầu với chút bối rối của những người khách lạ khi họ bước ra khỏi xe và được chào đón bởi toàn thể dân cư trong làng, lúc này có khoảng 200 người. Cứ như thể là những vị khách phương Tây ăn mặc chỉn chu này vừa đổ bộ từ hành tinh khác, theo một nghĩa nào đó thì quả có thế thật. Bọn học sinh bị đẩy lên trước và trình diễn một bài hát. Đổi lại, chúng được các vị khách tặng sách vở và kẹo. Một khoảng lặng căng thẳng bị phá vỡ khi Marissa Mayer, người dẫn đầu đoàn đại biểu, một phụ nữ 32 tuổi, nói: “Hãy giao lưu với họ đi.” Nhóm tỏa ra và bắt đầu tham gia vào cuộc đàm đạo đầy lúng túng với dân làng.
Khi Alex Vogenthaler tới hỏi chuyện một thanh niên mảnh khảnh đang cười hớn hở, rằng anh đã nghe đến Google bao giờ chưa. Đó là câu hỏi mà Alex không bao giờ phải đặt ra ở quê hương mình: Rõ ràng là tất cả mọi người ở Mỹ và mọi nơi trong thế giới mạng đều biết đến Google. Sản phẩm tìm kiếm trên Internet hiệu quả đến phi thường của nó đã thay đổi cách con người tiếp cận với thông tin, thay đổi cách người ta nghĩ về thông tin. Lần đầu phát hành cổ phiếu ra công chúng (IPO) của Google vào năm 2004 đã biến nó thành một gã khổng lồ kinh tế. Và những người sáng lập ra nó
https://thuviensach.vn
chính là ví dụ hoàn hảo của những bộ óc kỹ thuật cực kỳ thông minh, đại diện cho tương lai của ngành kinh doanh trong kỷ nguyên Internet. Anh trai làng thú nhận là không, anh chưa bao giờ nghe nói về Google cả. “Nó là cái gì vậy?”, anh hỏi. Vogenthaler cố gắng giải thích bằng cách đơn giản nhất rằng Google là một công ty hoạt động trên Internet. Người ta sử dụng nó để tìm kiếm thông tin. Anh có thể đưa ra cho nó một câu hỏi và nó sẽ ngay lập tức đưa cho anh câu trả lời từ những kho chứa thông tin khổng lồ mà nó thu thập được trên Mạng lưới toàn cầu (World Wide Web). Người thanh niên kiên nhẫn lắng nghe nhưng rõ ràng là anh này thân thuộc với đồng ruộng hơn là lĩnh vực tìm kiếm.
Rồi chàng thanh niên cầm một chiếc điện thoại di động lên, có vẻ như muốn hỏi: “Ý anh là cái này hả?”
Tín hiệu kết nối trên màn hình điện thoại hiển thị bốn vạch. Ở Mỹ, có những vùng lãnh thổ mà người ta hiếm khi nhận được sóng – hay thậm chí không thu được vạch sóng nào. Nhưng ở đây, vùng nông thôn Ấn Độ, sóng lại rất khỏe.
Thì ra, Google đang chuẩn bị cho một dự án trị giá nhiều triệu đôla để biến những chiếc điện thoại thông minh thành phụ kiện mang thông tin hỗ trợ cho bộ não của con người, cho phép mọi người ngay lập tức lấy thông tin từ một kho tri thức khổng lồ của thế giới. Chàng thanh niên này có thể chưa biết đến Google, nhưng công ty này sẽ sớm có mặt tại Ragihalli. Và lúc đó anh sẽ biết đến Google.
Tôi đã chứng kiến cuộc trao đổi này vào năm 2007 với tư cách là một phóng viên trong chuyến đi hàng năm của các trợ lý Giám đốc phụ trách sản phẩm (Associate Product Manager - APM), một nhóm được coi như những người lãnh đạo tương lai của công ty. Chúng tôi bắt đầu hành trình của mình ở San Fransico sau đó hạ cánh xuống Tokyo, Bắc Kinh, Bangalore và Tel Aviv trước khi trở về nhà sau 16 ngày.
Sự tham gia của tôi trong chuyến đi là kết quả của một mối quan hệ lâu dài với Google. Cuối năm 1998, tôi đã nghe đồn nhiều về một công cụ tìm
https://thuviensach.vn
kiếm thông minh hơn và đã dùng thử. Google tốt hơn hẳn tất cả những công cụ tôi đã từng sử dụng trước đó. Khi được nghe một chút về phương pháp mà công cụ này sử dụng để mang lại kết quả tốt đến vậy – nó dựa trên sự dân chủ trên nền tảng web – tôi lại càng thấy trí tò mò của mình bị kích thích. Đây là cách tôi đề cập đến nó trên tờ Newsweek phát hành ngày 22 tháng 2 năm 1999: “Google, công cụ tìm kiếm “nóng” nhất trên mạng, tự sàng lọc các phản hồi trên web(1) để đem đến những kết quả sát hơn với yêu cầu của khách hàng.”
Cũng trong năm đó, tôi thu xếp với Cindy McCaffrey, Giám đốc mới phụ trách truyền thông doanh nghiệp của Google, để tới thăm trụ sở công ty ở Mountain View. Tôi đã tới thăm rất nhiều công ty mới khởi nghiệp nên không quá ngạc nhiên với sự lộn xộn ấm cúng – một căn phòng rộng với những khoang nhỏ vẫn còn để trống và một đống bóng tập thể dục. Dù vậy, tôi đã không ngờ là thay vì vận những chiếc áo phông và quần jean truyền thống, đám nhân viên lại diện toàn đồ hóa trang. Tôi đã tới đúng vào lễ Halloween.
“Steven, đây là Larry Page và Sergey Brin”, Cindy giới thiệu tôi với hai anh chàng trẻ tuổi, những người vừa thành lập công ty với tư cách là học viên cao học của Đại học Stanford. Larry ăn mặc như một tên cướp biển Viking với một cái áo khoác lông thú và chiếc mũ có cặp sừng dài. Sergey mặc bộ đồ hình con bò. Trên ngực cậu là một tấm cao su, từ đó nhô ra mấy cái núm vú to đùng, đầy chấm nhỏ. Họ chào đón tôi rất vui vẻ và chúng tôi rút vào phòng họp, nơi Cướp biển và Bò giải thích sức mạnh kỳ diệu của công nghệ PageRank (xếp thứ hạng trang) của Google.
Đó là buổi phỏng vấn đầu tiên trong rất nhiều cuộc phỏng vấn tôi thực hiện tại Google. Trong vài năm sau đó, Google đã trở thành tâm điểm cho những báo cáo của tôi về công nghệ trên tờ Newsweek. Từ một công ty có xuất phát điểm nhỏ bé, Google đã nhanh chóng trở thành một đế chế với hơn 20.000 nhân công. Mỗi ngày, hàng tỉ người sử dụng công cụ tìm kiếm của nó, và khả năng đáng kinh ngạc của Google trong việc mang lại những kết quả tìm kiếm trong vòng vài phần nghìn giây đã thay đổi cách thức cả
https://thuviensach.vn
thế giới thu thập thông tin. Số lượng người nhấp chuột vào các thanh quảng cáo đã mang lại cho Google lợi nhuận lớn và biến những người sáng lập thành tỉ phú – đồng thời cũng châm ngòi cho những tiếng la ó phản đối từ phía nhóm người hưởng lợi từ quảng cáo truyền thống.
Google cũng trở nên nổi tiếng với văn hóa không phân biệt thứ bậc và cách thức đưa ra quyết định kinh doanh căn cứ trên số liệu; các chuyên gia quản trị xôn xao bàn tán về những phương pháp khác thường của nó. Năm tháng trôi qua, Google bắt đầu thể hiện sứ mệnh của mình – thu thập và khiến cho thông tin của thế giới trở nên dễ tiếp cận và hữu dụng – theo nghĩa rộng nhất có thể. Công ty tạo ra một loạt các ứng dụng trên nền tảng web đồng thời công bố ý định tạo phiên bản điện tử cho toàn bộ sách trên thế giới. Nó bắt đầu thâm nhập vào lĩnh vực hình ảnh vệ tinh, điện thoại di động, sản xuất năng lượng, lưu ảnh. Rõ ràng, Google là một trong những công ty có đóng góp quan trọng nhất cho cuộc cách mạng của máy tính và công nghệ, cuộc cách mạng đã đánh dấu một bước ngoặt trong nền văn minh. Tôi đã từng muốn viết một cuốn sách về công ty này nhưng chưa biết viết thế nào.
Rồi vào đầu tháng 7 năm 2007, tôi được đề nghị tham gia cùng đoàn trợ lý Giám đốc phụ trách sản phẩm trong chuyến đi của họ. Đó là một lời mời chưa từng có từ một công ty vốn thường hạn chế liên hệ giữa báo chí với nhân viên của mình. Tôi được biết rằng, chương trình APM là một sáng kiến rất có giá trị. Đây là trích dẫn một đoạn quảng bá mà một trong số các thành viên đã nói với những sinh viên sắp ra trường: “Chúng tôi đầu tư vào các APM của mình nhiều hơn bất cứ công ty nào từng đầu tư vào nhân viên trẻ của họ… Chúng tôi hình dung một thế giới nơi mọi người đều nghiêng mình kính nể trước sự thật rằng những nhà lãnh đạo của Google, những CEO giỏi nhất ở Thung lũng Silicon, và những bậc lãnh đạo được tôn trọng nhất trong các tổ chức phi Chính phủ toàn cầu đều trưởng thành từ chương trình APM của Google.” Eric Schmidt, CEO của Google nói với tôi: “Một trong những người này một ngày nào đó rất có thể sẽ là CEO của chúng tôi – chúng tôi chỉ chưa biết là người nào thôi.”
https://thuviensach.vn
18 APM trong chuyến đi đã từng làm việc trong tất cả các bộ phận của Google: Nghiên cứu, quảng cáo, ứng dụng và thậm chí là cả những dự án ngầm, ví dụ như nỗ lực của Google để có được quyền đăng tải các tạp chí trên danh mục của mình. Nhóm của Mayer, cùng với các APM, đã lập ra một kế hoạch của chuyến đi. Mỗi hoạt động đều có một mục đích ngầm định nhằm nâng cao hiểu biết về vấn đề công nghệ hay kinh doanh, hoặc khiến họ, theo cách nói của công ty, trở nên đậm “chất Google” hơn. Chẳng hạn, ở Tokyo, họ tham gia vào cuộc săn lùng đồ phế thải ở quận điện tử lừng danh Akihabara của thành phố. Mỗi đội của đoàn APM góp 50 đôla để mua những thiết bị kỳ quặc nhất mà họ có thể lùng được. Ngụp lặn trong những con ngách bầy bán đầy linh kiện điện tử, họ kết thúc với bộ sưu tập vô cùng phong phú: USB có hình gạt tàn đang bốc khói, cái đĩa mô phỏng bề mặt của mặt trăng; máy phân tích hơi thở có thể cài đặt trong ô tô và một chiếc đũa ngắn và mập mà khi vẫy tới vẫy lui sẽ hiện lên các từ bằng đèn LED. Ở Bangalore cũng có một cuộc săn hàng khác – một chuyến du ngoạn tới khu vực chợ, nơi diễn ra cuộc thi tìm người mặc cả giỏi nhất. (Một cách đào tạo tốt cho những vụ mua bán máy tính số lượng lớn hay thậm chí là mua một công ty Internet mới thành lập). Một điểm cao trào nữa ở Tokyo là chuyến đi đến chợ cá Tsukiji lúc 5 giờ sáng. Điều hấp dẫn các APM không phải món sushi tươi ngon mà là cơ chế đấu giá cá, theo một cách nào đó thì khá giống với cách Google vận hành chương trình quảng cáo AdWords của mình.
Ở Trung Quốc, các APM được nghe Kai-Fu Lee, Giám đốc phụ trách khu vực, nói về việc cân bằng giữa kiểu làm việc không bị ràng buộc bởi các luật lệ của nhân viên Google với các quy định của chính quyền sở tại - và công tác kiểm duyệt. Tuy nhiên, trong suốt buổi phỏng vấn với khách hàng Trung Quốc, các APM lại khá mất tinh thần khi nghe cách người dân địa phương nhìn nhận về công ty: “Baidu [đối thủ cạnh tranh tại Trung Quốc của Google] biết nhiều [về Trung Quốc] hơn Google,” một người trẻ tuổi nói với một APM.
https://thuviensach.vn
Ở mỗi văn phòng mà các APM ghé thăm, họ đều tham gia vào các cuộc họp với nhân viên Google địa phương, đầu tiên là để biết thêm về các dự án đang triển khai và sau đó thuật lại cho họ những việc diễn ra ở trụ sở tại Mountain View. Tôi bắt đầu thấy được cảm giác của người trong cuộc về các quy trình hoạt động của Google – và làm thế nào mà việc phục vụ người dùng của nó lại na ná giống như một cuộc vận động lớn. Đã có một khoảnh khắc thú vị ở Bangalore khi Mayer nhận câu hỏi từ phía những kỹ sư địa phương sau khi trình bày khái quát về một sản phẩm sắp ra đời. Một trong số những kỹ sư này hỏi: “Chúng tôi đã được nghe về đồ thị cho các sản phẩm, thế còn đồ thị cho doanh thu thì sao?” Cô suýt nữa thì nổi đóa lên với anh kỹ sư. “Đó không phải cách nghĩ của chúng ta,” cô nói: “Chúng ta tập trung vào người dùng. Nếu làm cho họ hạnh phúc, chúng ta sẽ có doanh thu.”
Phần hấp dẫn nhất trong chuyến đi là khoảng thời gian trải nghiệm với những nhân viên Google trẻ tuổi. Họ là những nhân viên ưu tú với điểm thi SAT(2) hoàn hảo hoặc gần hoàn hảo. Được lựa chọn cẩn thận từ hàng nghìn người sẵn sàng chết để có được công việc đó, tính cách và khả năng của họ phản ánh tính cách của chính Google. Trên xe buýt đi đến Vạn lý Trường thành của Trung Quốc, một trong số các APM đã thống kê nhân khẩu của nhóm và phát hiện ra rằng hầu hết trong số họ có bố mẹ là giáo sư và trên nửa có bố mẹ đã từng giảng dạy tại trường đại học – cũng giống như những người sáng lập ra Google. Tất cả họ đều lớn lên cùng với Internet và coi các định luật của nó tự nhiên như là nguyên lý vạn vật hấp dẫn. Họ nằm trong số những người thông minh và tham vọng nhất của thế hệ được trang bị tốt hơn thế hệ đi trước trong việc kiểm soát những làn sóng kỹ thuật ồ ạt. Đầu óc họ cộng hưởng mạnh mẽ với các giá trị về tốc độ, tính linh hoạt cũng như thái độ trân trọng số liệu của công ty.
Tuy nhiên, ngay cả khi chìm đắm giữa bong bóng lạc quan của những thanh niên trẻ tuổi này, tôi vẫn có thể nhận thấy trạng thái căng thẳng gắn liền sự phát triển đột phá của Google, từ một công ty non trẻ đầy nhiệt huyết trở thành một gã khổng lồ thống trị thị trường với hơn 20.000 nhân
https://thuviensach.vn
viên. Các APM dành một năm trời để lèo lái con đường truyền thống của một tập đoàn lớn, dù với sự khác biệt hoàn toàn – và giờ đây họ đã gần như trở thành những nhân viên hàng đầu. Thêm một điều nữa, tôi đã rất sửng sốt khi phát hiện ra rằng không một ai trong số những người bạn đồng hành của tôi nghĩ rằng 5 năm nữa mình vẫn làm việc cho Google. Marissa Mayer tiếp nhận tin này một cách bình tĩnh, khẳng định rằng ngay từ đầu, chính tham vọng đó là lý do họ được tuyển dụng. “Đây chính là kiểu gen mà Larry và Sergey tìm kiếm,” cô nói với tôi, “ngay cả nếu họ rời bỏ công việc, điều đó vẫn tốt cho chúng tôi. Họ sẽ mang theo ADN của Google đi cùng với mình.”
Sau thời gian gần một thập kỷ theo sát Google, tôi nghĩ rằng mình đã biết về nó khá rõ, nhưng chuyến đi kéo dài hai tuần này đã giúp tôi có được một góc nhìn khác, khiến tôi nhìn nhận công ty dưới ánh sáng rộng lớn và khác lạ hơn. Tuy nhiên, vẫn còn khá nhiều ẩn số. Google là một công ty được xây dựng dựa trên các giá trị của những người sáng lập ra nó, những người có tham vọng xây dựng một tập đoàn vững mạnh có ảnh hưởng đến toàn thế giới, đồng thời có cả sự căm ghét thói quan liêu và các ràng buộc phải có khi điều hành một công ty như vậy. Google đề cao sự trong sạch đạo đức thông qua phương châm chính thức của mình: “Đừng có xấu tính”, nhưng dường như có một “điểm mù” liên quan đến hậu quả mà công nghệ về sự riêng tư và quyền sở hữu của nó đem lại. Nguyên tắc nền tảng của Google là được phục vụ người dùng, nhưng một mục tiêu tạo ra một bộ máy trí tuệ nhân tạo khổng lồ sẽ mang lại hậu quả không mong muốn, ảnh hưởng đến cuộc sống của tất cả chúng ta. Ngay từ đầu, những người sáng lập công ty nói rằng họ muốn thay đổi thế giới. Nhưng họ là ai? Và họ hình dung trật tự thế giới mới sẽ như thế nào?
Sau chuyến đi, tôi nhận ra rằng cách tốt nhất để trả lời những câu hỏi này là viết càng nhiều càng tốt về những điều diễn ra bên trong Google. Tôi sẽ cố gắng để ngụp lặn sâu hơn vào kỹ thuật, cuộc sống và văn hóa của nó, để viết về cách nó thực sự hoạt động, phát triển các sản phẩm và kiểm soát sự
https://thuviensach.vn
phát triển cũng như hình ảnh của mình trước công chúng. Tôi sẽ là một người ngoài cuộc với góc nhìn của người trong cuộc.
Tất nhiên, để làm điều này, tôi cần sự hợp tác. May mắn thay, dựa trên mối quan hệ lâu dài của chúng tôi, các nhà điều hành Google, bao gồm “LSE” – Larry Page, Sergey Brin và Eric Schmidt – đã đồng ý để cho tôi tham gia. Trong hai năm tiếp theo – khoảng thời gian nhạy cảm khi vầng hào quang của Google bị mất đôi chút ánh sáng của mình ngay cả khi công ty tăng trưởng mạnh mẽ hơn – tôi đã phỏng vấn hàng trăm nhân viên cũ và mới của Google, đồng thời tham dự một loạt các cuộc họp trong công ty. Chúng bao gồm cuộc họp phát triển sản phẩm, “đánh giá giao diện”, ra mắt sản phẩm tìm kiếm, họp kín, họp TGIF(3), và các cuộc họp quan trọng khác về Chiến lược Sản phẩm của Google (GPS), nơi các dự án và sáng kiến được phê duyệt hoặc bị từ chối. Tôi cũng tham gia rất nhiều bữa ăn tại trụ sở của Google.
Tôi đã nhận ra Google là một công ty luôn hứng thú với sự lộn xộn đầy sáng tạo, ngay cả khi sự sáng tạo không phải lúc nào cũng ổn định như mong muốn. Google có các mục tiêu lớn và các giá trị của toàn bộ công ty đều xuất phát từ những người sáng lập. Mục tiêu của nó là thu thập và sắp xếp thông tin của thế giới – và đó chỉ là khởi đầu. Ngay từ đầu, những người sáng lập đã coi Google là một phương tiện để hiện thực hóa giấc mơ về trí tuệ nhân tạo trong sự phát triển giá trị nhân loại. Để thực hiện ước mơ của mình, Page và Brin cần phải xây dựng một công ty lớn. Cùng lúc đó, họ lại cố gắng duy trì càng nhiều càng tốt sự tự do linh hoạt, ngang tàng, độc lập của một công ty nhỏ mới thành lập. Trong hai năm nghiên cứu cuốn sách này, sự xung đột giữa những mục tiêu đạt đến đỉnh điểm.
Góc nhìn từ bên trong của tôi cũng cung cấp cho tôi chìa khóa để hé mở nhiều bí mật nằm trong hai “hộp đen” của Google – công cụ tìm kiếm và mô hình quảng cáo của nó – hơn bất cứ một góc nhìn nào trước đó. Phương pháp tìm kiếm của Google là một phần cuộc sống của chúng ta và hệ thống quảng cáo của nó là sản phẩm thương mại quan trọng nhất của thời đại Internet. Trong cuốn sách này, lần đầu tiên độc giả có thể tìm hiểu đầy đủ
https://thuviensach.vn
câu chuyện về phát triển, sự tiến hóa và hoạt động bên trong của công ty. Hiểu biết về những sản phẩm đột phá này giúp chúng ta hiểu về Google và các nhân viên của nó bởi vì hoạt động của họ là hiện thân của cả giá trị và triết lý công nghệ của công ty. Quan trọng hơn, hiểu được những điều đó sẽ giúp chúng ta hiểu thế giới và tương lai của mình.
Nhà văn khoa học viễn tưởng William Gibson đã từng nói rằng tương lai vốn đã ở đây, chỉ không được phân bố đều mà thôi. Ở Google, tương lai đã đang diễn ra. Hiểu về công ty đi tiên phong này và nhân viên của nó cũng là nắm bắt được vận mệnh của công nghệ. Và xin trân trọng giới thiệu Nội soi Google: Cách Google suy nghĩ, vận hành và định hình cuộc sống của chúng ta.
https://thuviensach.vn
PHẦN 1:
THẾ GIỚI TRONG MẮT GOOGLE Tiểu sử một công cụ tìm kiếm
1.
“Ðó là tiểu thuyết khoa học viễn tưởng chứ không phải là khoa học máy tính.” Ngày 18 tháng 2 năm 2010, thẩm phán Denny Chin của tòa án liên bang Quận Nam New York ngồi nghiên cứu đống hồ sơ ngồn ngộn trong Phòng xử án 23B. Đó sẽ là một ngày dài. Ông sẽ chủ trì một phiên điều trần không mang lại gì hơn là những thông tin bổ sung cho hàng trăm đơn đệ trình ông đã nhận được về vụ việc này. “Thật quá sức,” ông nói. Ông lắc đầu và chuẩn bị sẵn sàng để nghe những lập luận của 27 đại diện thuộc các nhóm lợi ích hoặc các tập đoàn khác nhau, cũng như phần trình bày của các luật sư cho các bên, những vị luật sư này ngồi kín hai chiếc bàn dài trước mặt ông.
Đó là vụ án Hội Tác giả, Hiệp hội xuất bản Mỹ… chống lại Công ty Google. Đó là vụ kiện được dự kiến giải quyết bằng một thỏa thuận hòa giải dân sự, trong đó một nhóm tác giả và nhà xuất bản đưa ra các điều kiện cho một công ty công nghệ để scan và bán sách. Quyết định của thẩm phán Chin sẽ liên quan đến các vấn đề có ảnh hưởng tới tương lai của các sản phẩm kỹ thuật số và một số phát ngôn viên đã nhấn mạnh vào các vấn đề này trước khi phiên tòa diễn ra. Nhưng rất nhiều trong số những người phản đối – và hầu hết những người lên tiếng trong phiên tòa đều phản đối thỏa hiệp này – lại tập trung vào một công ty non trẻ đóng trụ sở tại khuôn
https://thuviensach.vn
viên trường đại học ở Mountain View, California. Đó chính là Google. Các phát ngôn viên có vẻ ngờ vực, e dè, thậm chí xem thường nó. “Một mối đe dọa lớn với... tự do ngôn luận và sự tham gia vào đa dạng văn hóa”
“Một sự độc quyền phi nghĩa”
“Xâm phạm nghiêm trọng quyền riêng tư”
“Che giấu và đánh lạc hướng”
“Cố định giá... sự bóp méo thị trường nghiêm trọng... dày vò sự tuyệt vọng”
“Hẳn là một hành vi vi phạm luật chống độc quyền”
(Tuyên bố cuối cùng mang ý nghĩa quan trọng, vì đó là tuyên bố của trợ lý Chánh văn phòng luật sư Hoa Kỳ.)
Nhưng chính quyền liên bang mới chỉ là một trong các đối thủ gây kinh ngạc của Google. Một số người ủng hộ lợi ích công cộng, giám sát quyền riêng tư và túi tiền của công dân. Những người khác là những người ủng hộ tự do ngôn luận. Thậm chí còn có một người phản đối đại diện cho ca sĩ nhạc đồng quê Arlo Guthrie.
Trớ trêu là bản thân Google lại bị tấn công vì đã coi thường các giá trị thiêng liêng và các chuẩn mức đạo đức cao mà nó rất mực trân quý. Những người sáng lập công ty luôn nói rằng mục tiêu của họ là làm cho thế giới tốt hơn, cụ thể bằng cách giúp mọi người tiếp cận được với thông tin của nhân loại. Google đã tạo ra một công cụ đáng kinh ngạc có thể tận dụng tính chất kết nối của các mạng toàn cầu, một công cụ cho phép mọi người tìm kiếm thông tin, thậm chí cả những thông tin mơ hồ chỉ trong vòng vài giây. Công cụ tìm kiếm này đã thay đổi cách thức mọi người làm việc, giải trí và học tập. Google làm ra lợi nhuận vô cùng ấn tượng từ sản phẩm đó bằng cách tạo ra một hình thức quảng cáo mới không xâm phạm đến ai và thậm chí còn hữu ích cho mọi người. Công ty tuyển dụng những bộ óc sắc bén nhất trên thế giới và khuyến khích họ đối diện với những thách thức có thể đẩy ranh giới của sự đổi mới đi xa hơn. Sự tập trung của công ty vào việc mài
https://thuviensach.vn
giũa tài năng để hoàn thành mục tiêu khó khăn là một cảm hứng mang tầm quốc gia. Đôi khi, Google thậm chí còn cảnh báo các cổ đông rằng có lúc mình sẽ theo đuổi các hoạt động kinh doanh phục vụ nhân loại, ngay cả khi hoạt động đó mang lại lợi nhuận thấp hơn. Nó thực hiện tất cả những thành quả đạt được với một sự ngang tàng tinh quái khiến cả cộng đồng phải mê đắm và biến nhân viên của mình thành những anh hùng.
Nhưng điều đó không quan trọng đối với những người phản đối trong phòng xử án của thẩm phán Chin. Những người này vốn ủng hộ Google, và giờ họ nghĩ rằng Google không còn… tốt nữa. Sự mất lòng tin và nỗi sợ hãi trong phòng xử án đã được phản ánh qua nỗi lo lắng của các Chính phủ bởi những chính sách riêng tư của Google và sự e ngại của các doanh nghiệp khi nghĩ rằng mình sẽ trở thành mục tiêu tiếp theo cho các hoạt động vô kỷ luật của Google. Các nhà quản lý Google đi tới đâu cũng phải đối mặt với phản đối và kiện tụng.
Diễn biến của hàng loạt sự kiện đã gây trở ngại cho hai nhà sáng lập Google, Larry Page và Sergey Brin. Trong tất cả các dự án của Google, dự án gây tranh cãi trong phiên tòa – dự án Google’s Book Search (tìm kiếm sách) – có lẽ là mang tính lý tưởng nhất. Đó là một nỗ lực rất táo bạo nhằm số hóa mọi cuốn sách đã in để cho bất cứ ai trên thế giới cũng có thể định vị được thông tin trong đó. Google sẽ không cho không toàn bộ nội dung sách, thế nên khi người dùng tìm thấy những thông tin đó, họ sẽ có lý do để mua chúng. Các tác giả sẽ có được thị trường mới; người đọc sẽ có thể tiếp cận với tri thức rất nhanh chóng. Sau khi bị các nhà xuất bản và các tác giả khởi kiện, Google cam kết với họ rằng điều đó sẽ tạo điều kiện cho việc tiếp cận với các cuốn sách và mua ngay lập tức. Mọi thư viện sẽ nhận được một thiết bị đầu cuối(1) miễn phí để kết nối với toàn bộ sách trên thế giới. Với Google, đó là một ân huệ cho cả nền văn minh.
Người ta không hiểu điều đó sao?
Dù sao đi nữa, công ty vẫn phát triển thịnh vượng. Google vẫn giữ được hàng trăm triệu người dùng, chủ trì hàng tỉ lệnh tìm kiếm mỗi ngày, và đã phát triển hoạt động sang cả video và các dịch vụ không dây. Nhân viên
https://thuviensach.vn
“Đừng có xấu tính” vẫn luôn tin tưởng và kỳ vọng vào công ty với những tình cảm tốt đẹp nhất. Nhưng bóng đen giờ đã phủ lên hình ảnh của Google. Với nhiều người ngoài, phương châm chung mà Google nghiêm túc tuân theo – “Đừng có xấu tính” – đã trở thành một trò đùa, một công cụ để chống chính Google.
Đã có chuyện gì vậy?
Làm tốt là kế hoạch của Larry Page ngay từ khi mới bắt đầu. Từ lúc còn nhỏ, anh đã muốn trở thành một nhà phát minh, không đơn thuần bởi vì đầu óc tư duy của anh hoàn toàn ăn khớp với mối liên hệ giữa lôgic và công nghệ (thực sự là thế) mà còn bởi, như anh nói, “Tôi thực sự muốn thay đổi thế giới.”
Page lớn lên ở Lansing, Michigan, ở đó cha anh dạy khoa học máy tính tại trường Đại học bang Michigan. Cha mẹ anh ly hôn khi anh 8 tuổi, nhưng anh vẫn thân thiết với cả cha và mẹ – mẹ anh cũng có bằng cấp về khoa học máy tính. Một cách rất tự nhiên, ngôn ngữ máy tính trở thành ngôn ngữ chính của anh. Sau này, anh có chia sẻ với một phóng viên: “Tôi nghĩ mình là đứa trẻ đầu tiên trong trường tiểu học nộp bài ở dạng file word có xử lý.”
Page không phải là một động vật xã hội(2) – những người nói chuyện với anh thường tự hỏi không biết liệu có chút biểu hiện nào của hội chứng Asperger(3)trong anh không – và có thể làm cho người ta căng thẳng chỉ đơn giản bằng cách không nói năng gì. Nhưng khi đã nói, anh thường xổ ra những sáng kiến gần như quái dị. Việc tham gia vào một chương trình mùa hè về lãnh đạo (phương châm: “Nói không với không thể”) đã thúc đẩy anh hành động. Ở Đại học Michigan, anh trở nên ám ảnh về lĩnh vực vận tải và vạch ra kế hoạch cho một hệ thống đường tàu một ray tinh vi ở Ann Arbor, thay thế cho hệ thống xe buýt tầm thường với một hệ thống phương tiện “viễn tưởng” để di chuyển giữa ký túc xá và các phòng học. Anh dường như rất ngạc nhiên vì một ý tưởng siêu việt về giao thông trị giá nhiều triệu đôla từ một sinh viên chưa ra trường lại không nhanh chóng được đón nhận
https://thuviensach.vn
và thực hiện. (15 năm sau khi tốt nghiệp, Page đã đề cập lại vấn đề này trong một buổi họp với hiệu trưởng nhà trường.)
Không thể không ghi nhận trí thông minh và sức tưởng tượng của anh. Nhưng khi đã hiểu về anh thì bạn sẽ biết rằng điều nổi bật ở anh lại là tham vọng. Tham vọng đó thể hiện không chỉ như động lực cá nhân (dù cũng có cả yếu tố đó) mà là nguyên tắc chung rằng mọi người nên tư duy thật lớn lao và biến những điều lớn lao thành hiện thực. Anh tin rằng thất bại thực sự duy nhất là không thử những điều táo bạo. “Ngay cả nếu bạn thất bại với điều mà mình khao khát, thì đó cũng không phải là thất bại hoàn toàn,” anh nói. “Đó là điều mà mọi người không hiểu.” Page luôn luôn nghĩ về điều đó. Khi ai đó đề xuất một giải pháp ngắn hạn, bản năng của Page luôn là nghĩ cho dài hạn. Điều đó cuối cùng trở thành một câu chuyện đùa giữa những người trong Google, rằng Page “tới tương lai rồi quay về kể lại cho chúng tôi”.
Page có bằng khoa học máy tính giống như cha mình. Nhưng số phận của anh là ở California, đặc biệt là ở Thung lũng Silicon. Theo một cách nào đó, tới Stanford chẳng khác gì chuyến hồi hương đối với Page. Anh sống ở đó một thời gian ngắn vào năm 1979 khi cha anh đi du khảo ở Stanford; một vài thành viên trong khoa vẫn nhớ anh, một cậu bé 7 tuổi với trí tò mò không bao giờ được thỏa mãn. Năm 1995, Stanford không chỉ là nơi duy nhất hoàn hảo cho việc theo đuổi ngành khoa học máy tính có vị trí tiên phong này, mà do bùng nổ Internet, đây còn là nơi tập trung tham vọng của cả thế giới. May mắn thay, Page đã để ý đến cả vấn đề thương mại: “Rất có thể là từ khi 12 tuổi, tôi đã biết cuối cùng mình sẽ thành lập một công ty,” về sau anh kể lại. Anh trai của Page, lớn hơn anh 9 tuổi, lúc đó đang ở Thung lũng Silicon và làm việc cho một công ty mới khởi nghiệp trong lĩnh vực Internet.
Page quyết định làm việc cho công ty Human-Computer Interaction (HCI). Công việc này sẽ trao cho Page một vị thế tốt trong tương lai về mặt phát triển sản phẩm, ngay cả khi việc tìm ra một mô hình mới để thu thập thông tin không phải là lĩnh vực chính của HCI. Trên bàn làm việc và thấm
https://thuviensach.vn
nhuần trong các cuộc trò chuyện của anh là bộ sách Tâm lý học cho những điều thường nhật (The Psychology of Everyday Things) của bậc thầy về giao diện của Apple, Donald Norman, kinh thánh của một thứ tôn giáo mà điều răn trước nhất, và có lẽ là duy nhất, nói rằng “Người dùng luôn luôn đúng.” (Những môn đệ khác của Norma, chẳng hạn Jeff Bezos của Amazon.com, đã kế tục chính điều này trong lĩnh vực web.) Một cuốn sách gây ảnh hưởng khác đến Page là tiểu sử của Nikola Tesla, một nhà khoa học Serbia tài năng; dù những cống hiến của Tesla được cho là có thể sánh ngang với Thomas Edison – và tham vọng của ông cũng đủ mãnh liệt để gây ấn tượng ngay cả với Page – nhưng ông đã chết trong hoàn cảnh chẳng mấy ai biết đến mình. “Hồi đó tôi thấy ông là một nhà phát minh vĩ đại và đó là một câu chuyện buồn,” Page nói. “Tôi cảm thấy đáng lẽ ông đã đạt được nhiều hơn rất nhiều nếu có thêm nguồn lực. Và ông đã gặp rắc rối khi thương mại hóa những thứ mình làm ra. Đáng lẽ ông không nên gặp phải quá nhiều rắc rối đến vậy. Tôi nghĩ đó là một bài học tốt. Tôi không muốn chỉ phát minh ra các thứ, tôi còn muốn làm cho thế giới tốt đẹp hơn, và để làm được điều đó, ngoài phát minh, bạn còn phải làm nhiều việc nữa.”
Mùa hè trước khi nhập học tại Stanford, Page tham gia một chương trình dành cho các thí sinh trúng tuyển, trong đó có một chuyến đi tới San Francisco. Người hướng dẫn là một sinh viên đã tốt nghiệp tầm tuổi Page, vừa học ở Stanford trong hai năm. “Hồi đó tôi nghĩ anh ta khá là đáng ghét,” Page sau này nói về người hướng dẫn, Sergey Brin. Nội dung của cuộc chạm trán bây giờ chỉ còn như câu chuyện cổ tích, nhưng bất chấp sự trái ngược trong tính cách, theo một cách nào đó thì họ giống nhau y hệt. Cả hai đều cảm thấy thoải mái nhất với chế độ nhân tài của giới hàn lâm, nơi trí tuệ là vua. Cả hai, từ trong máu, đều thấu hiểu cái thế giới liên kết cực kỳ chặt chẽ mà họ tận hưởng với tư cách là các sinh viên về khoa học máy tính (computer science - CS) sẽ mở rộng ra toàn xã hội. Cả hai cùng chia sẻ niềm tin cốt tủy về tính ưu việt của số liệu. Và cả hai đều cực kỳ bướng bỉnh khi theo đuổi niềm tin của mình. Khi Page ổn định vào tháng 9
https://thuviensach.vn
năm đó, anh trở thành bạn thân với Brin, đến mức mọi người nhắc tới họ như một bộ: Larry và Sergey.
Sinh ra ở Nga, Brin lên 4 tuổi khi gia đình anh nhập cư vào Mỹ. Tiếng Anh của anh vẫn còn phảng phất ngữ âm của Nga, và cách nói chuyện của anh thi thoảng vẫn còn tí chút cách thể hiện lỗi thời của Cựu Thế giới như cách diễn đạt “whatnot” trong khi bạn bè cùng trang lứa thì nói “stuff like that”(4). Anh tới Stanford vào năm 19 tuổi sau khi lướt vèo qua Đại học Maryland, nơi cha anh dạy học, trong ba năm; anh là một trong những sinh viên trẻ nhất từ trước tới nay bắt đầu học chương trình tiến sĩ ở Stanford. “Anh ấy bỏ qua cả triệu năm,” Craig Silverstein, người tới Stanford một năm sau, và sau này đã trở thành nhân viên đầu tiên của Google, nói. Sergey là một cậu nhóc tinh quái lướt vèo vèo qua những hành lang của Stanford trên chiếc giày trượt. Anh còn rất yêu thích môn xà đu. Nhưng các giảng viên hiểu rằng đằng sau vẻ ngoài ngốc nghếch đó là một tư duy toán học đáng nể. Chẳng bao lâu sau khi tới Stanford, anh chinh phục tất cả các bài kiểm tra mà học vị tiến sĩ phải có và được tự do thử tất cả các khóa học cho tới khi tìm được cách tiếp cận thích hợp cho luận án. Anh bổ sung những hoạt động hàn lâm của mình bằng bơi lội, thể dục và chèo thuyền. (Khi cha anh hỏi trong tuyệt vọng rằng liệu anh có kế hoạch học tiếp các khóa cao cấp không, anh nói chắc anh sẽ học bơi cao cấp.) Donald Knuth, một giảng viên của Stanford – tác giả của loạt sách lẫy lừng về nghệ thuật lập trình máy tính đã khiến ông được mệnh danh là Proust(5) của mã máy tính – nhớ lại chuyện lái xe xuống bờ biển Thái Bình Dương để đàm đạo với Sergey vào một buổi chiều nọ và đã vô cùng ấn tượng với sự am tường các vấn đề phức tạp của anh. Cố vấn của anh, Hector Garcia-Molina, đã gặp rất nhiều cậu bé sáng dạ ở Stanford, nhưng Brin nổi bật hẳn. “Cậu ấy quả là rất thông minh,” Garcia-Molina nhận xét.
Một nhiệm vụ mà Brin thực hiện là hệ thống đánh số cho Tòa nhà Khoa học Máy tính Gates – tòa nhà này sẽ là trụ sở của bộ môn. (Hệ thống của anh sử dụng những tinh hoa toán học). Công trình được đặt tên theo William Henry Gates III, được biết đến nhiều hơn dưới cái tên Bill Gates,
https://thuviensach.vn
đồng sáng lập Microsoft. Mặc dù Gates đã học hai năm ở Harvard và đã hiến tặng một tòa nhà được đặt theo tên mẹ ông ở đó, ông tiếp tục phô trương tí xíu bằng việc tài trợ cho những trụ sở mới nguy nga của các bộ môn khoa học máy tính thuộc các tổ chức công nghệ hàng đầu mà ông không theo học, bao gồm MIT và Carnegie Mellon – cùng với Stanford, ba tổ chức đứng đầu trong các chương trình CS. Ngay cả cười vào mũi Windows, thế hệ sau của các thầy phù thủy vẫn học trong những tòa nhà đặt theo tên Bill Gates.
Liệu Gates có bao giờ tưởng tượng được rằng một trong những tòa nhà đó sẽ nuôi dưỡng một đối thủ có khả năng hủy diệt Microsoft không? Chương trình tiến sĩ khoa học máy tính ở Stanford được xây dựng quanh mối quan hệ thân thiết giữa sinh viên và thành viên trong khoa. Họ tập trung lại thành nhóm để giải quyết những vấn đề to lớn, thực tế; cách nhìn mới mẻ của những con người trẻ trung giúp duy trì sinh khí cho những mối quan tâm của giảng viên. “Bạn lúc nào cũng bị cuốn theo sinh viên,” Terry Winograd, cố vấn của Page, nói. Qua nhiều năm, Winograd đã trở thành chuyên gia trong việc xác định xem sinh viên đang ở vị trí nào trong thế giới những bộ óc vĩ đại của những người tìm được đường vào khoa này. Một vài cậu có thành tích trước khi tốt nghiệp toàn là A+, điểm GRE(6) xấp xỉ mức tối đa, nhưng sẽ luôn hỏi: “Em nên thực hiện luận án nào?” Cực bên kia của thế giới này là những nghiên cứu sinh như Larry Page, những anh chàng này thường khẳng định: “Đây là việc em nghĩ em có thể làm.” Và những đề xuất của anh chàng này thì đúng là điên rồ. Cậu sẽ vào văn phòng và nói về việc làm gì đó với dây cáp không gian hay những cánh diều năng lượng mặt trời. “Đó là khoa học viễn tưởng nhiều hơn là khoa học máy tính,” Winograd nhớ lại. Nhưng một tư duy lạ lùng là một tài sản quý giá, và chắc chắn là có một chỗ trong nền khoa học hiện tại để khơi thông sức sáng tạo dữ dội.
Vào năm 1995, đó là thời điểm của Mạng toàn cầu World Wide Web. Nó bắt nguồn từ bộ óc hoạt động không ngừng của một kỹ sư kỳ quặc người Anh tên là Tim Berners-Lee, một kỹ thuật viên ở phòng thí nghiệm nghiên
https://thuviensach.vn
cứu vật lý CERN, Thụy Sĩ. Berners-Lee có thể tổng kết tầm nhìn của mình trong một câu: “Giả sử thông tin lưu trữ trong máy tính ở khắp nơi liên kết được với nhau… thì sẽ có một không gian thông tin duy nhất trên toàn cầu.”
Trước thời điểm vinh quang của Berners-Lee, đã tồn tại một hệ thống khổng lồ, nơi người ta có thể tự do đăng tải và kết nối tài liệu của mình: Mạng Internet. Mặc dù những website đầu tiên chỉ là cách để phân phối các bài viết hàn lâm hiệu quả hơn, người ta nhanh chóng bắt tay vào việc viết các trang với đủ các loại thông tin và những người khác thì tạo ra các trang chỉ để giải trí. Giữa những năm 1990, người ta bắt đầu sử dụng mạng với mục đích lợi nhuận, và một từ mới, “thương mại điện tử” (e-commerce) xuất hiện trong vốn từ vựng của nhân loại với những gã khổng lồ như Amazom.com hay eBay.
Khi mạng phát triển hơn, cấu trúc kết nối của nó tích lũy được một giá trị phi thường. Tất cả các nội dung trên mạng được sắp xếp như một tổ hợp ý tưởng lớn, bất cứ ý tưởng nào cũng có thể được tiếp cận bằng hành động kết nối một tài liệu này với một tài liệu khác. Khi nhìn vào một trang, bạn có thể thấy những chỉ dẫn tới các trang khác mà chủ web đã mã hóa trên trang này, thường được đánh dấu màu xanh da trời – đó chính là ý tưởng siêu văn bản đã từng thôi thúc Bush, Nelson và Atkinson(7). Nhưng lần đầu tiên, đúng như Berners-Lee dự tính, mạng đã thu hút được một số lượng cực lớn các trang và tài liệu kết nối với nhau tập trung vào một mạng duy nhất. Thực tế là, mạng đã trở thành một cơ sở dữ liệu vô tận, một dạng thế giới đang mở rộng điên cuồng của tri thức nhân loại mà, theo lý thuyết, có thể chứa đựng mọi hiểu biết, suy nghĩ, hình ảnh và sản phẩm để bán. Và tất cả liên kết chéo với nhau trong một mạng lưới chằng chịt được tạo ra bởi hoạt động kết nối độc lập của bất cứ ai đã từng xây dựng nên một trang và mã hóa một kết nối tới một nơi nào đó khác trên mạng.
Sáng tạo của Berners-Lee mới mẻ đến nỗi khi Stanford nhận được tài trợ từ Quỹ Khoa học Quốc gia NSF vào đầu những năm 1990 để bắt đầu một chương trình có tên gọi Dự án Thư viện số, mạng đã không hề được nhắc
https://thuviensach.vn
tới trong đề xuất. “Chủ đề chính của dự án là khả năng tương tác giữa các phần – làm thế nào để khiến cho những nguồn lực này phối hợp với nhau?” Hector Garcia-Molina – người đồng sáng lập dự án – nhớ lại. Tuy nhiên, tới năm 1995, Garcia-Molina biết rằng Mạng Toàn cầu sẽ là một phần không thể thiếu của các dự án được dựng lên bởi những sinh viên đã làm việc với chương trình này, trong đó có Page và Brin.
Brin vốn đã có quan hệ với Quỹ Khoa học Quốc gia và không cần tài trợ, nhưng anh đã cố gắng tìm ra một đề tài luận án. Anh tập trung chủ yếu vào việc khai thác số liệu, và với Rajeev Motwani, một giảng viên trẻ khá thân thiết với Brin, anh đã giúp khởi động một nhóm nghiên cứu gọi là MIDAS, viết tắt cho Mining Data at Stanford (Khai thác số liệu ở Stanford). Trong một hồ sơ cá nhân được đăng tải trên trang của Stanford năm 1995, anh nhắc tới một “dự án mới” nhằm tạo ra hệ thống xếp hạng phim được cá nhân hóa. “Nó hoạt động như sau,” anh viết. “Bạn đánh giá các bộ phim mình đã xem. Rồi hệ thống sẽ tìm kiếm những người dùng khác với gu thưởng thức tương tự để ngoại suy mức độ bạn thích các bộ phim khác.” Một dự án mà anh tiến hành cùng Garcia-Molina và một sinh viên khác là hệ thống phát hiện vi phạm bản quyền bằng các chương trình tự động tìm kiếm bản sao của các tài liệu. “Cậu ấy đã nghĩ ra một vài thuật toán hay để phát hiện các bản sao,” Garcia-Molina kể. “Giờ thì bạn sử dụng Google.”
Lúc đó, Page cũng đang tìm đề tài luận án. Một ý tưởng, cộng tác với Brin, mà anh trình bày với Winograd có vẻ hứa hẹn hơn những ý tưởng khác: tạo ra một hệ thống mà ở đó người ta có thể để lại lời chú giải và bình luận trên các website. Nhưng Page càng nghĩ về việc chú giải, nó lại càng rối tinh. Với các site lớn, hẳn sẽ có rất nhiều người muốn đánh dấu một trang. Làm thế nào bạn xác định được ai là người được phép bình luận hay bình luận của người nào bạn sẽ xem đầu tiên? Vì thế, anh nói: “Chúng ta cần một hệ thống xếp hạng.”
Chắc chắn là chúng ta sẽ không sử dụng con người để quyết định các thứ bậc. Thứ nhất, đó là việc quá phi thực tế. Hơn nữa, con người thì không đáng tin. Chỉ có các thuật toán – được đúc rút tốt, xử lý hiệu quả và dựa
https://thuviensach.vn
trên số liệu hợp lý – mới có thể đưa ra những kết quả khách quan. Như vậy, vấn đề là cần tìm ra số liệu thích hợp để quyết định xem bình luận của ai đáng tin cậy hoặc thú vị hơn những người khác. Page nhận ra rằng những số liệu như thế vẫn luôn tồn tại và chưa có ai khác thực sự sử dụng đến nó. Anh hỏi Brin. “Tại sao chúng ta lại không sử dụng các kết nối trên mạng để làm việc đó nhỉ?”
Page, lớn lên trong môi trường hàn lâm, hiểu rằng các kết nối trên mạng cũng giống như các câu trích dẫn trong một bài báo có tính học thuật. Ai cũng hiểu rằng bạn sẽ có thể biết được bài báo nào là thực sự quan trọng mà không cần phải đọc chúng – chỉ bằng cách tổng kết lại xem có bao nhiêu tờ báo khác dẫn chiếu đến chúng trong phần ghi chú và phụ lục tài liệu. Page tin rằng nguyên tắc này cũng có thể phát huy tác dụng với các trang mạng. Nhưng để có được số liệu phù hợp thì không dễ. Các trang mạng đều tạo đường link rất rõ ràng. Dựng thành mã là cách đánh dấu rất dễ xác định cho những đích đến mà bạn có thể di chuyển tới bằng một cú nhấp chuột từ một trang. Nhưng những điều được kết nối đến một trang lại không rõ ràng chút nào. Để tìm ra điều đó, bạn phải làm sao thu thập được cơ sở dữ liệu của các đường dẫn kết nối với một vài trang khác. Lúc đó, bạn sẽ quay ngược lại.
Vì thế, Page gọi hệ thống của mình là BackRup và Winograd nghĩ rằng đó là ý tưởng tuyệt vời cho một dự án, nhưng không phải một dự án đơn giản. Để làm được điều đó, ông nói với Page, cậu thực sự phải hiểu rõ được cấu trúc kết nối của Mạng Toàn cầu. Page nói, chắc chắn rồi, anh sẽ tìm, tải mạng về và tìm hiểu cấu trúc. Anh cho rằng việc này sẽ mất chừng một tuần. “Và tất nhiên,” sau này anh nhớ lại, “việc đó đã mất tầm hàng năm.” Nhưng Page và Brin đã xông vào nó. Tất cả những tuần khác, Page đều tới văn phòng của Garcia-Molina hỏi xin đĩa và thiết bị. “Tốt thôi,” Garcia Molina nói. “Đó là một dự án tuyệt vời, nhưng các cậu cần kiếm kinh phí cho tôi.” Ông yêu cầu Page chọn một con số, nói xem anh cần mầy mò bao nhiêu về mạng nữa và để ước tính còn cần bao nhiêu đĩa nữa. “Tôi muốn mầy mò toàn bộ mạng,” Page nói.
https://thuviensach.vn
Page thỏa mãn bản thân với đôi chút tự mãn khi đặt tên phần hệ thống xếp hạng các website dựa trên các kết nối đến là chương trình xếp hạng Page (PageRank). Nhưng đó là một kiểu tự mãn tinh quái; rất nhiều người cho rằng cái tên đó là muốn nói tới các trang mạng (web pages) chứ không phải tên người.
Vì Page không phải là một nhà lập trình tầm thế giới, anh đề nghị một người bạn giúp sức. Scott Hassan là trợ lý nghiên cứu toàn thời gian tại Stanford, làm việc cho chương trình Dự án Thư viện số. Hassan cũng là bạn tốt của Brin, hai người gặp nhau trong một trận Ultimate Frisbee(8) vào tuần đầu tiên của anh ở Stanford. Chương trình của Page “có quá nhiều lỗi, điều đó chẳng đáng cười chút nào,” Hassan kể lại. Anh quyết định lấy chương trình của Page và viết lại nó thành ngôn ngữ mà anh hiểu rõ hơn, và không có lỗi nào hết.
Anh viết một chương trình bằng Python – một ngôn ngữ linh hoạt hơn mà về sau đã trở nên thông dụng cho các chương trình trên nền web – hoạt động như một “con nhện”, gọi như vậy là bởi vì nó sẽ len lỏi khắp trên mạng để tìm số liệu. Chương trình sẽ ghé thăm một trang web, tìm tất cả các kết nối và xếp chúng theo thứ tự. Rồi nó sẽ kiểm tra xem trước đây mình đã ghé thăm những trang liên kết này chưa. Nếu chưa, nó xếp kết nối vào dạng đích đến sẽ ghé thăm trong tương lai và lặp lại quy trình. Bởi vì Page không quen thuộc với Python, Hassan trở thành thành viên của nhóm. Anh và một sinh viên khác, Alan Steremberg, trở thành trợ lý có hưởng lương của dự án.
Brin, nổi trội về toán, nhận một nhiệm vụ vô cùng lớn là nghiền ngẫm những phép toán giúp làm rõ mớ bòng bong những kết nối mà cuộc khảo sát khổng lồ về một mạng Internet đang ngày càng phát triển của họ đã tìm ra.
Mặc dù hoạt động của nhóm đã có được những bước tiến nhất định, họ vẫn không chắc lắm đích đến của mình là gì. “Larry không có kế hoạch nào cả,” Hassan kể. “Trong nghiên cứu, bạn khám phá thứ gì đó và xem có trở ngại gì không.”
https://thuviensach.vn
Tới tháng 3 năm 1996, họ bắt đầu một đợt kiểm tra, khởi đầu ở một trang đơn lẻ, trang chủ của Bộ môn Khoa học Máy tính ở Stanford. Con nhện đã định vị được các kết nối trên trang và tỏa ra khắp các site có liên kết đến Stanford, rồi tới các site liên kết tới những website đó. “Đợt đầu tiên đó chỉ sử dụng tựa đề của các tài liệu vì thu thập chính các tài liệu sẽ đòi hỏi rất nhiều số liệu và công sức,” Page giải thích. Sau khi thu gom được khoảng 15 triệu tựa đề như vậy, họ kiểm tra chương trình để xem các website nào có vẻ như có nhiều quyền lực hơn.
“Ngay cả bộ kết quả đầu tiên cũng rất có tính thuyết phục,” Hector Garcia-Molina nói. “Ai xem chương trình chạy thử này cũng thấy rõ đây là một cách rất tốt, rất tuyệt vời để sắp xếp mọi thứ.”
“Chúng tôi nhận thấy nó làm việc thực sự, thực sự tốt,” Page chia sẻ. “Và tôi nói: ‘Chà, vấn đề lớn ở đây không phải là ghi chú. Chúng ta nên sử dụng nó không chỉ để xếp hạng các ghi chú mà còn để xếp hạng các tìm kiếm nữa.’” Đây dường như là một ứng dụng đương nhiên cần có cho một phát minh có thể đưa ra thứ hạng cho mọi trang trên mạng.
Anh nói: “Với tôi và những người còn lại của nhóm thì rõ ràng là nếu bạn có cách xếp hạng mọi thứ dựa trên không chỉ chính trang đó mà còn trên cả những điều mà thế giới nghĩ về trang đó thì đó sẽ là điều thực sự có giá trị cho việc tìm kiếm.”
Dẫn đầu trong lĩnh vực tìm kiếm trên mạng vào thời đó là một chương trình có tên AltaVista, sản phẩm của Phòng thí nghiệm Nghiên cứu Phương Tây thuộc Tập đoàn Thiết bị Số (DEC). Nhà thiết kế chính là Louis Monier, một người Pháp kỳ dị đồng thời là một con mọt máy tính đầy lý tưởng, người đã tới Mỹ với tấm bằng tiến sĩ từ năm 1980. DEC được tạo dựng trên máy tính mini, đã từng là một lĩnh vực tân tiến mà nay đã bị cuộc cách mạng máy tính cá nhân đẩy vào chỗ tuyệt diệt. “DEC cứ đắm mình trong quá khứ,” Monier nói: “Nhưng họ có một nhóm nhỏ những người tư duy rất tiến bộ, thử nghiệm với rất nhiều loại đồ chơi.” Một trong những đồ chơi đó chính là mạng. Bản thân Monier không phải chuyên gia trong lĩnh vực thu thập thông tin nhưng lại vô cùng hâm mộ số liệu về mặt lý thuyết.
https://thuviensach.vn
“Với tôi, đó là số liệu bí mật,” ông nói. Điều mà số liệu nói với ông là nếu bạn có những công cụ thích hợp, thì bạn hoàn toàn có thể đối xử với mọi thứ trên mạng mở như với một tài liệu đơn lẻ.
Ngay cả ở buổi sơ khai đó, nền tảng cơ bản của tìm kiếm trên mạng đã được thiết lập sẵn. Tìm kiếm là một quy trình bốn bước. Đầu tiên là một lượt quét nhanh qua tất cả các trang mạng trên thế giới, qua một con nhện. Thứ hai là lập bảng chú giải cho các thông tin mà con nhện thu về và lưu giữ số liệu trên máy chủ. Bước thứ ba, phân tích yêu cầu của người dùng để xác định các trang có vẻ như phù hợp nhất để trả lời cho câu hỏi. Kết quả đó được gọi là chất lượng tìm kiếm. Bước cuối cùng liên quan đến việc định dạng và đưa các kết quả đó tới người dùng.
Monier quan tâm nhất tới bước thứ hai, quá trình ngốn thời gian để bò khắp hàng triệu tài liệu và gom số liệu. “Hồi đó quá trình mầy mò còn chậm, bởi vì đầu bên kia sẽ phải mất chừng bốn giây để trả lời,” Monier nói. Một ngày nọ, khi đang nằm bên bể bơi, ông nhận ra là bạn có thể thu được mọi thứ một cách nhanh chóng bằng cách thực hiện song song quá trình, gom số liệu từ nhiều trang cùng một lúc. Con số phù hợp, ông kết luận, là một nghìn trang một lúc. Monier tìm ra cách tạo được bọ tìm kiếm có khả năng làm việc với quy mô như vậy. “Trên một máy tôi có một nghìn chuỗi, các quy trình độc lập yêu cầu mọi thứ và không dẫm vào chân nhau.”
Đến cuối năm 1995, mọi người ở Phòng thí nghiệm nghiên cứu phía Tây của DEC đều đã sử dụng công cụ tìm kiếm của Monier. Ông đã phải rất khó khăn mới có thể thuyết phục các vị sếp của mình đưa công cụ này ra công chúng. Họ tranh luận rằng chẳng có cách nào để kiếm được tiền từ một công cụ tìm kiếm nhưng rồi cũng dịu lại khi Monier bán chúng trong lĩnh vực quan hệ công chúng. (Hệ thống sẽ là một minh chứng cho sản phẩm chip xử lý Alpha mới rất mạnh của DEC.) Vào ngày ra mắt, AltaVista có 16 triệu tài liệu trong chỉ mục của mình, dễ dàng qua mặt bất cứ một công cụ nào khác trên mạng. “Những chỉ mục lớn hồi đó có lẽ có khoảng một triệu trang,” Monier nói. Đó là sức mạnh của AltaVista: Bề rộng. Khi DEC
https://thuviensach.vn
mở sản phẩm này ra cho cả người ngoài vào tháng 12 năm 1995, gần 300.000 người đã dùng thử. Họ đều choáng ngợp.
Các công nghệ chất lượng tìm kiếm thực sự của AltaVista – điều quyết định thứ tự xếp hạng của các kết quả – được dựa trên các thuật toán thu thập thông tin (Information Retrieval – IR) truyền thống. Nhiều trong số những thuật toán đó được phát triển từ công trình của một người tị nạn phát xít Đức tên là Gerard Salton – người đã tới Mỹ, có được tấm bằng tiến sĩ ở Harvard và chuyển tới Đại học Cornell. Tại đây, ông cùng đồng nghiệp đã sáng lập ra bộ môn khoa học máy tính. Tìm kiếm qua cơ sở dữ liệu sử dụng cùng các lệnh mà bạn dùng với con người – “ngôn ngữ tự nhiên” trở thành một khái niệm nghệ thuật – là chuyên môn của Salton.
Suốt những năm 1960, Salton đã phát triển một hệ thống mà sau này trở thành hình mẫu cho việc thu thập thông tin. Nó được gọi là SMART, được cho là viết tắt của cụm từ “Bộ máy thu thập văn bản kỳ diệu của Salton” (Salton’s Magical Retriever of Text). Hệ thống thiết lập nên nhiều quy ước mà đến nay vẫn còn tồn tại trong công nghệ tìm kiếm, bao gồm phân loại và các thuật toán tương ứng. Khi Salton mất năm 1995, công nghệ của ông vẫn còn thống trị trong lĩnh vực này. Một năm sau đó, một viện sĩ thành kính viết: “Salton đã là biểu tượng của thu thập thông tin trong suốt 30 năm.”
Mạng toàn cầu sắp thay đổi điều đó, nhưng các viện sĩ không hề biết – và AltaVista cũng vậy. Mặc dù những người sáng tạo ra nó có ý thức thu thập tất cả mọi thứ trên mạng nhưng họ bỏ lỡ mất cơ hội tận dụng cấu trúc liên kết. “Đột phá là ở chỗ tôi không ngại đem về nhiều mạng hết sức có thể, lưu nó lại vào một chỗ, và có thời gian phản ứng thực sự nhanh chóng. Đó chính là điểm mới lạ,” Monier nói. Trong khi đó, AltaVista phân tích nội dung ở mỗi trang cụ thể – sử dụng các thước đo như mỗi từ xuất hiện bao nhiêu lần – để xem liệu trang đó có khớp với một từ đưa ra trong câu lệnh hay không.
Ngay cả khi không có cách rõ ràng nào để kiếm tiền từ việc tìm kiếm, AltaVista cũng đã có một vài đối thủ. Đến năm 1996, khi tôi viết về việc
https://thuviensach.vn
tìm kiếm cho tờ Newsweek, các nhà lãnh đạo từ một số công ty đều vỗ ngực tự nhận là có dịch vụ hữu ích nhất. Khi bị dồn, tất cả bọn họ đều thừa nhận rằng trong cuộc đua giữa mạng Internet hổ lốn và công nghệ mới ra đời của họ, mạng chiếm phần thắng. “Công nghệ IR kiểu học thuật đã mất 30 năm để có được vị trí này – chúng tôi đang khai phá vùng đất mới, nhưng thật khó khăn,” Graham Spencer, người kỹ sư đứng đằng sau công cụ tìm kiếm do một công ty khởi nghiệp tên là Excite tạo ra, than phiền. Giám đốc phụ trách kỹ thuật của AltaVista, Barry Rubinson nói: “Vấn đề đầu tiên là sự tương thích phụ thuộc vào đánh giá của từng người. Vấn đề thứ hai là hiểu được ý nghĩa của những câu lệnh ngắn đến kỳ dị và vô cùng khó hiểu được gõ vào ô tìm kiếm của AltaVista.”
Không ai trong các công ty tìm kiếm nhắc đến chuyện sử dụng các liên kết.
Các liên kết là lý do khiến dự án nghiên cứu của Stanford trở thành mối quan tâm hàng đầu. Chương trình Xếp hạng PageRank của Larry Page rất hiệu quả vì rõ ràng là nó phân tích những liên kết này và gán cho chúng một con số, một thước đo theo thang từ 1 đến 10, cho phép bạn thấy được độ nổi bật của trang so với mọi trang khác trên mạng. Một trong những phiên bản đầu tiên của BackRub mới chỉ đơn giản là đếm những liên kết đến, nhưng Page và Brin đã nhanh chóng nhận ra rằng không chỉ số lượng các liên kết mà cả người đang thực hiện liên kết cũng tạo sự liên quan giữa các yếu tố. PageRank phản ánh được thông tin đó. Tình trạng trang tạo ra liên kết đó càng nổi bật, liên kết đó càng có giá trị và càng được đánh giá cao khi tính toán con số PageRank cuối cùng của chính trang web đó. “Ý tưởng đằng sau PageRank là bạn có thể đánh giá tầm quan trọng của trang web bằng các trang web liên kết tới nó,” Brin nói. “Thực ra, chúng tôi phát triển nhiều bài toán để giải quyết vấn đề đó. Các trang quan trọng có xu hướng liên kết tới những trang quan trọng. Chúng tôi chuyển đổi toàn bộ mạng thành một phương trình lớn với vài trăm triệu biến số, tức là số hạng PageRank của tất cả các trang web, và hàng triệu điều kiện, tức là tất cả các liên kết.” Đó chính là phép tính toán mà Brin sử dụng cho khoảng 500 triệu
https://thuviensach.vn
biến số để xác định các trang quan trọng. Điều này giống như việc nhìn vào một bản đồ đường hàng không: Các thành phố trung tâm sẽ nổi bật lên nhờ tất cả các đường thể hiện các chuyến bay đến và đi từ đó. Các thành phố có nhiều đường giao thông kết nối nhất với các trung tâm khác rõ ràng là trung tâm chính của khu vực dân cư. Điều tương tự cũng áp dụng được cho các website. “Tất cả là phép hồi quy,” Page kể lại. “Theo một cách nào đó, mức độ tuyệt vời của bạn được quyết định bởi những người liên kết tới bạn, và những người bạn liên kết tới sẽ quyết định bạn tuyệt đến đâu. Đó là một vòng tròn lớn. Nhưng toán học rất kỳ diệu. Bạn có thể giải quyết được điều đó.”
Điểm xếp hạng PageRank sẽ được kết hợp với nhiều công nghệ thu thập thông tin truyền thống hơn, ví dụ như so sánh từ khóa với nội dung văn bản trên trang và quyết định mối liên quan bằng cách kiểm tra các yếu tố như tần suất, cỡ phông chữ, viết hoa và vị trí của từ khóa. Những yếu tố đó được biết đến như những tín hiệu, và chúng rất quan trọng đối với chất lượng tìm kiếm. Có một vài mili giây cực kỳ quan trọng trong quy trình tìm kiếm trên mạng, trong quãng đó, công cụ sẽ diễn giải từ khóa và tiếp cận với một chỉ mục rộng lớn, nơi tất cả nội dung văn bản trên hàng tỉ trang được lưu trữ và sắp xếp giống như mục lục trong một cuốn sách. Tại điểm này, công cụ cần được giúp đỡ để xác định cách sắp xếp những trang đó. Vì thế, nó tìm kiếm các dấu hiệu – các đặc điểm có thể giúp công cụ phát hiện được những trang thỏa mãn câu hỏi. Tự bản thân PageRank cũng là một dấu hiệu. Một trang web với thứ hạng PageRank cao gửi đi thông điệp tới công cụ tìm kiếm rằng nó là một nguồn đáng tin cậy hơn những trang có thứ hạng thấp hơn.
Mặc dù PageRank là cây đũa thần của BackRub, nó chỉ là sự kết hợp của thuật toán đó với các tín hiệu khác để tạo ra những kết quả đáng kinh ngạc. Nếu từ khóa khớp với tựa đề của trang web hay tên miền, trang đó sẽ được xếp hạng cao hơn. Với những lệnh tìm có nhiều từ, các tài liệu có chứa tất cả các từ sát với các từ trong lệnh tìm kiếm thường sẽ được ghi nhận nhiều giá trị hơn những trang có chứa các cụm không hề liên quan chút nào. Một
https://thuviensach.vn
tín hiệu mạnh mẽ khác là “nội dung đường dẫn” của các kết nối dẫn tới trang. Ví dụ, nếu một trang web sử dụng từ “Bill Clinton” để kết nối đến Nhà Trắng, “Bill Clinton” sẽ là nội dung đường dẫn. Bởi vì giá trị cao được gán cho nội dung đường dẫn, một lệnh BackRub cho “Bill Clinton” sẽ đặt trang www.whitehouse.gov lên vị trí kết quả đầu tiên bởi vì có rất nhiều trang web có thứ hạng PageRank cao sử dụng tên của vị tổng thống này để liên kết tới site của Nhà Trắng. “Khi bạn thực hiện một lệnh tìm kiếm, trang phù hợp sẽ xuất hiện, thậm chí nếu trang đó không có chứa đúng những từ mà bạn đang tìm kiếm,” Scott Hassan nói. “Điều đó khá là tuyệt.” Đó cũng là điều mà các công cụ tìm kiếm khác không làm được.
PageRank còn có một lợi thế lớn khác. Đối với các công cụ tìm kiếm phụ thuộc vào phương thức IR truyền thống để phân tích nội dung, mạng đề ra một thách thức khủng khiếp. Có hàng triệu triệu trang, và ngày càng nhiều trang được thêm vào, hiệu quả hoạt động của các hệ thống đó hiển nhiên giảm sút. Đối với những site đó, tốc độ mở rộng của mạng chính là vấn đề, sự kiệt quệ trong các nguồn lực của họ. Nhưng nhờ có PageRank, mạng càng phát triển, BackRub càng tốt lên. Nhiều site hơn đồng nghĩa với nhiều liên kết hơn. Những thông tin thêm vào này cho phép BackRub xác định càng chính xác hơn những trang có thể liên quan tới câu hỏi. Và càng có nhiều liên kết thì càng cải thiện được sự mới mẻ của site. “PageRank có được lợi ích nhờ việc học tập từ toàn bộ Mạng toàn cầu,” Brin giải thích.
Tất nhiên, Brin và Page cũng gặp phải một số vấn đề khi cố gắng thâu tóm toàn bộ mạng. Những ngày đó, rất nhiều trong số những người điều hành các website chỉ hiểu biết về công nghệ ở mức tối thiểu – không quen với việc các site của mình bị sục xạo. Một số người nhìn vào nhật ký của mình và thấy những chuyến ghé thăm thường xuyên từ trang www.stanford.edu nên nghi ngờ rằng trường rất có thể đang lấy cắp thông tin của họ. Về mặt lý thuyết, họ có thể chặn sự ghé thăm của các con “bọ tìm kiếm” của Google bằng cách đặt một đoạn mã nhỏ trên các site của họ gọi là /robots.txt, nhưng các chủ web tức giận không hề lĩnh hội khái niệm đó. “Larry và Sergey làm cho mọi người bực mình đến nỗi không nghĩ ra
https://thuviensach.vn
nổi /robots.txt,” Winograd kể, “nhưng cuối cùng, họ đã thực sự dựng lên một danh sách cấm ghé thăm, điều mà họ không hề muốn.” Thậm chí cả khi đó, Page và Brin vẫn tin vào hệ thống tự phục vụ hoạt động trên diện rộng, phục vụ cho cộng đồng dân cư lớn. Các biện pháp ngăn chặn thủ công bị ghét cay ghét đắng.
Brin và Page rơi vào một cái vòng luẩn quẩn. Nếu các trang đưa ra một câu hỏi nhất định không được sắp xếp theo một trình tự hợp lý, họ sẽ quay trở lại thuật toán và xem có điều gì chưa đúng. Gán tỷ trọng hợp lý cho các tín hiệu khác nhau là một hành động cân bằng không đơn giản. Page sử dụng hệ thống xếp hạng cho từ khóa “đại học” như một thí nghiệm thử quỳ. Anh chú ý đặc biệt tới thứ hạng tương ứng của ngôi trường đầu tiên của mình, Michigan, và ngôi trường hiện tại, Stanford. Brin và Page cho rằng Stanford sẽ được xếp hạng cao hơn, nhưng Michigan lại vượt qua nó. Liệu đó có phải là một thiếu sót trong thuật toán không? Không. “Chúng tôi quyết định rằng Michigan có nhiều thứ trên mạng hơn và điều đó là hợp lý,” Page giải thích.
Việc tạo danh sách này thể hiện sức mạnh của PageRank. Nó khiến cho BackRub hữu dụng hơn nhiều so với các kết quả mà bạn có được từ các công cụ tìm kiếm thương mại.
Page và Brin đã cho ra mắt dự án của mình như một bàn đạp cho những luận án mà mình có thể thực hiện. Nhưng không thể chối cãi được là họ bắt đầu nhìn sản phẩm sáng tạo của mình như một thứ gì đó có thể kiếm ra tiền cho họ. Chương trình khoa học máy tính của Stanford vừa là một tổ chức hàn lâm, vừa không khác gì vườn ươm doanh nghiệp. David Cheriton, một trong các giảng viên, từng nhận định: “Lợi thế bất công mà Stanford có được so với bất cứ nơi nào khác trong cái vũ trụ này là ở chỗ bao quanh chúng tôi là Thung lũng Silicon.” Không hề hiếm việc các giáo sư của trường có chân trong cả hai thế giới, vừa nghiên cứu và giảng dạy tại khoa, vừa hoạt động trong lĩnh vực công nghệ cao của các công ty khởi nghiệp đang cố gắng giành lấy thành công rực rỡ. Thậm chí còn có một câu nói
https://thuviensach.vn
đùa rằng các thành viên trong khoa sẽ không được vào biên chế cho tới khi họ mở công ty.
Bản thân Cheriton là một ví dụ điển hình cho các mạng lưới Stanford cho ra đời các công ty và làm giàu cho những người sáng lập. Một trong những cú ghi bàn vàng đầu tiên từ Stanford là việc thành lập Sun Microsystem do một nhóm gồm Andy Bechtolsheim, Vinod Khosla và Bill Joy thực hiện. Cheriton rất gần gũi với Bechtolsheim, vì thế năm 1995, khi Bechtolsheim quyết định thành lập Granite Systems, một công ty khởi nghiệp về mạng, họ đã liên kết với nhau. 18 tháng sau, Cisco mua lại công ty với giá 220 triệu đôla.
Sergey Brin, trong khi trượt pa-tanh khắp các hành lang của Gates Hall, đã lưu ý tới việc đó. Dù Brin và Page không học lớp của Cheriton, họ đã tới văn phòng của ông để xin lời khuyên. Cụ thể, họ muốn biết làm thế nào họ có thể khiến một công ty quan tâm tới việc sử dụng PageRank cho công nghệ tìm kiếm của nó. Cheriton nói với họ rằng việc đó sẽ khó khăn, ông nhắc họ nhớ rằng Sun Microsystems đã bắt đầu phải đối mặt với thất bại khi các công ty đều bác bỏ những nỗ lực nhằm bán công nghệ máy trạm của Bechtolsheim.
Tuy nhiên, tại thời điểm đó Brin và Page vẫn còn chần chừ chưa muốn tự mình thử sức. Họ đều nhắm tới Stanford với dự định trở thành tiến sĩ như những người cha của mình.
Nhưng xin cấp bằng cho công cụ tìm kiếm của họ không phải là dễ. Mặc dù Brin và Page có được một buổi họp tốt đẹp với những người sáng lập Yahoo, Jerry Yang và David Filo, đều là cựu sinh viên Stanford, Yahoo không thấy có nhu cầu mua công nghệ công cụ tìm kiếm. Họ cũng gặp gỡ cả một người thiết kế của AltaVista có vẻ quan tâm tới BackRub. Nhưng những người thông thái ở trụ sở của DEC tại Maynard, Massachusetts cũng từ chối ý tưởng đó. Với họ, chẳng có gì là phát minh ở đây.
Có lẽ lần Page và Brin tiến gần tới thành công nhất là khi họ gặp gỡ Vinod Khosla, một quỹ mạo hiểm đã tài trợ cho Excite, một công ty tìm kiếm đã bắt đầu – cũng giống như Yahoo – với một đám những sinh viên
https://thuviensach.vn
sáng láng của Stanford. Terry Winograd, cố vấn của Sergey, đồng hành cùng họ tới buổi gặp này.
Việc này đã dẫn tới buổi họp với các nhà sáng lập Excite, Joe Kraus và Graham Spencer, tại Fuki Sushi, một nhà hàng ở Palo Alto. Những người của Excite bắt đầu các cuộc thử nghiệm so sánh với BackRub, đưa vào các lệnh tìm kiếm như “Bob Marley.” Các kết quả đều tốt hơn của Excite nhiều lần.
Larry Page vạch ra một kế hoạch tỉ mỉ, anh miêu tả chi tiết kế hoạch này trong các thư điện tử gửi Khosla tháng 1 năm 1997. Excite sẽ mua BackRub, sau đó một mình Larry sẽ tới đó làm việc. Anh tuyên bố: Việc Excite ứng dụng công nghệ BackRub sẽ làm tăng lượng truy cập lên 10%. Suy luận rằng do doanh thu từ quảng cáo tăng, Excite sẽ thu về thêm 130.000 đôla mỗi ngày, tổng số là 47 triệu đôla mỗi năm. Page hình dung nhiệm kỳ của mình ở Excite sẽ kéo dài bảy tháng, đủ lâu để giúp công ty vận hành công cụ tìm kiếm. Sau đó anh sẽ rời đi, vào khoảng thời gian kỳ học mùa thu năm 1997 ở Stanford, khởi động lại quá trình làm tiến sĩ của mình. “Với sự giúp đỡ của tôi,” cậu sinh viên chưa tròn 24 tuổi viết, “công nghệ này sẽ mang lại cho Excite một lợi thế vững vàng và sẽ đẩy công ty lên vị trí dẫn đầu thị trường.”
Nhưng thương vụ không bao giờ xảy ra. Hassan nhớ lại buổi họp quyết định mà rất có thể nó đã nhấn chìm thương vụ đó. Khi nhóm tới văn phòng của Bell, vị CEO mới của Excite và là cựu lãnh đạo của tạp chí Times Mirror, họ khởi động BackRub trên một cửa sổ và Excite trên một cửa sổ khác để đọ sức trực tiếp.
Đề kiểm tra đầu tiên là lệnh tìm kiếm từ “Internet”. Theo lời Hassan, các kết quả đầu tiên của Excite là mấy trang web của Trung Quốc với từ tiếng Anh “Internet” đứng giữa một rừng những từ tiếng Trung. Rồi nhóm gõ “Internet” vào chương trình BackRub. Hai kết quả đầu tiên cho ra các trang hướng dẫn sử dụng các trình duyệt. Nó chính xác là loại kết quả hữu ích hẳn sẽ làm hài lòng hầu hết những người thực hiện lệnh tìm kiếm đó.
https://thuviensach.vn
Bell thể hiện sự thất vọng rõ rệt. Sản phẩm của Stanford quá tốt. Nếu Excite làm chủ một công cụ tìm kiếm ngay lập tức đưa ra cho mọi người thông tin mà họ tìm kiếm, anh giải thích, người dùng sẽ rời site ngay lập tức. Bởi vì doanh thu quảng cáo của anh đến từ những người tiếp tục ở lại trên site – “bám trụ” là hệ số đo lường đáng ao ước nhất trên các website ở thời bấy giờ – sử dụng công nghệ của BackRub sẽ phản tác dụng. “Anh ấy nói với chúng tôi là anh ấy muốn công cụ tìm kiếm của Excite đạt được 80% chất lượng các công cụ tìm kiếm khác,” Hassan kể. Và phản ứng của chúng tôi là: “Ối chà, mấy gã này không biết họ đang nói về cái gì.”
Hassan kể anh đã giục Larry và Sergey rời Stanford và thành lập công ty ngay từ lúc đó, khoảng đầu năm 1997. “Những người khác đều đang làm như vậy,” anh nói. “Tôi thấy Hotmail và Netscape hoạt động thực sự tốt. Tiền đang chảy về Thung lũng. Vậy nên tôi nói với họ: ‘Công cụ tìm kiếm là một ý tưởng. Chúng ta nên làm việc này.’ Họ không nghĩ vậy. Larry và Sergey đều rất quả quyết rằng họ có thể xây dựng công cụ tìm kiếm này tại Stanford.”
“Hồi đó chúng tôi không... có lối tư duy kiểu doanh nhân,” về sau Sergey thú thực.
Hassan rời khỏi dự án. Anh nhận vào làm tại một công ty mới tên là Alexa và làm việc bán thời gian cho eGroups, một công ty khởi nghiệp. Larry và Sergey, dù vẫn gặp không ít khó khăn – nhưng mỗi người đã hỗ trợ 5.000 đôla để giúp anh mua máy tính cho eGroups. (Khoản đầu tư đó sau chưa tới ba năm đã mang lại kết quả khi Yahoo mua lại eGroups với giá khoảng 413 triệu đôla.)
Nhưng trong một năm rưỡi sau đó, tất cả các công ty họ tiếp cận đều khiến họ thất vọng. Chỉ có rất ít người quan tâm nhưng cái giá họ đưa ra quá thấp. Do vậy, Page và Brin quyết định quay trở lại Stanford để nghiên cứu thêm. Page nói: “Không phải là chúng tôi muốn nhiều tiền, nhưng chúng tôi muốn món đó thực sự được sử dụng. Họ muốn chúng tôi làm việc ở đó, và chúng tôi hỏi: ‘Mình có thực sự muốn làm việc cho công ty đó không?’ Mấy công ty này sẽ không tập trung vào lĩnh vực tìm kiếm – họ sẽ
https://thuviensach.vn
trở thành các cổng giao dịch điện tử. Họ không hiểu gì về tìm kiếm, và họ không phải những con người công nghệ.”
Tháng 9 năm 1997, Page và Brin đặt lại tên cho BackRub. Họ muốn có một cái tên phù hợp với việc kinh doanh. Một người bạn cùng phòng ký túc với Page gợi ý cho họ gọi nó là “googol.” Đây là một thuật ngữ trong toán học, chỉ con số có số 1 đứng trước 100 số 0. Đôi khi từ “googolplex” cũng được sử dụng để chỉ một con số lớn khủng khiếp. “Cái tên phản ánh phạm vi của điều chúng tôi đang thực hiện,” vài năm sau Brin giải thích. “Càng về sau, nó càng thực sự là một lựa chọn tốt, bởi vì bây giờ chúng tôi có hàng triệu trang và ảnh cùng các nhóm, các tài liệu, cũng như hàng trăm triệu lượt tìm kiếm một ngày.” Page đánh vần nhầm từ đó, điều này hóa ra lại cũng ổn vì địa chỉ Internet cho từ đánh vần đúng đã được sử dụng rồi. Còn tên “Google” thì chưa ai dùng. “Nó cũng dễ gõ và dễ nhớ,” Page nói.
Một đêm nọ, Sergey đã thiết kế trang chủ của Google bằng một chương trình đồ họa mã nguồn mở có tên là GIMP. Mỗi chữ cái trong tên của công ty được thiết kế một màu khác nhau, tạo thành một logo tương tự như cái gì đó được làm từ các khối hình của trẻ con. Nó truyền tải ý nghĩa của một sự ngẫu hứng đáng yêu. Anh đặt một dấu chấm than sau cái tên, giống như Yahoo, một công ty Internet khác được thành lập bởi hai vị tiến sĩ bỏ học của Stanford. “Cậu ấy muốn nó tươi vui và trẻ trung,” Page nói. Không giống nhiều trang web khác, trang chủ của Google sơ sài đến nỗi nó trông như là chưa được hoàn thành. Trang có một hộp để gõ các yêu cầu và hai nút bên dưới, một để tìm kiếm và một được gắn nhãn I’m Feeling Lucky (Tôi thấy mình may mắn), một cam kết tự tin gây sửng sốt ám chỉ rằng, không giống như các đối thủ khác, Google có khả năng đáp ứng chính xác nhu cầu của bạn ngay ở lần thử đầu tiên. (Có một lý do khác cho nút ấn đó. “Mục đích của nó thay thế hệ thống tên miền dùng để định hướng,” Page giải thích năm 2002. Cả Page và Brin đều hy vọng rằng thay vì đoán xem địa chỉ của đích đến trên mạng của mình là gì, người ta sẽ đơn giản là “lên trang Google.”) Ngày hôm sau Brin chạy quanh bộ môn Khoa học máy tính của Stanford, khoe sản phẩm sáng tạo GIMP của mình. “Anh hỏi mọi
https://thuviensach.vn
người xem liệu có cần đưa thêm những thứ khác lên trang đó không,” một giảng viên của Stanford, Dennis Allison, kể lại. “Và tất cả mọi người đều trả lời không.” Với Page và Brin thì như thế là ổn. Càng nhiều thứ trên trang, trang sẽ chạy càng chậm hơn. Và cả hai người bọn họ, đặc biệt là Page, đều tin rằng tốc độ là điều tối quan trọng để làm hài lòng người sử dụng. Sau này Page phát hiện ra một điều rất khôi hài, đó là mọi người ca ngợi thiết kế đó vì việc sử dụng không gian màu trắng rất mang hơi hướng Thiền. “Trường phái nghệ thuật tối thiểu(9)là do chúng tôi không có một người quản trị mạng và phải tự mình làm lấy,” anh giải thích.
Sau đó, BackRub-đổi thành-Google đã phát triển tới mức các phương tiện ở Stanford không còn đáp ứng được nhu cầu vận hành của nó. Nó không còn giống một dự án về hoạt động tìm kiếm nữa mà ngày càng giống một công ty khởi nghiệp hoạt động từ một trường đại học tư. Sự chần chừ của Page và Brin đối với việc viết một bài báo về công việc của họ đã trở thành “tiếng xấu đồn xa” trong khắp bộ môn. “Mọi người kháo nhau: ‘Sao việc này lại bí mật quá vậy? Đây là một dự án mang tính hàn lâm, chúng ta nên biết nó làm việc thế nào chứ,’” Terry Winograd kể.
Có vẻ như Page khá mâu thuẫn về vấn đề thông tin. Một mặt, anh toàn tâm tin tưởng vào triết lý chia sẻ kiến thức của hacker. Đó cũng là một phần mục đích chính của dự án này: Khiến cho tri thức nhân loại dễ tiếp cận hơn, khiến cho thế giới trở nên tốt đẹp hơn. Nhưng đồng thời anh cũng có ý thức mạnh mẽ về việc bảo vệ thông tin độc quyền mà khó khăn lắm anh mới giành được.
Nhưng vấn đề ngăn trở Brin và Page không chỉ có sự kín đáo. Việc viết một bài báo đối với họ không thú vị bằng việc tạo dựng một cái gì đó. “Vốn dĩ, Larry và Sergey không có thiên hướng viết lách – họ thiên về sản phẩm,” Winograd nhận xét. “Nếu có thêm 10 phút, họ sẽ muốn cải thiện cái gì đó. Họ không muốn dùng 10 phút đó để nói với bạn về những gì họ đã làm.” Nhưng cuối cùng Winograd cũng thuyết phục được họ giải thích về PageRank trên một diễn đàn chung. Họ giới thiệu một bài báo có tựa đề “Mổ xẻ một công cụ tìm kiếm web siêu văn bản với phạm vi rộng” (The
https://thuviensach.vn
Anatomy of Large-Scale Hypertextual Web Search Engine) tại một hội thảo ở Úc vào tháng 5 năm 1998.
Có lần Arthur Clarke(10) nhấn mạnh rằng công nghệ tốt nhất không khác phép thuật là mấy. Và chương trình tìm kiếm Google quả thật giống với phép màu. Ở Stanford, giáo viên và bạn bè của Larry và Sergey đã sử dụng công cụ tìm kiếm để trả lời các câu hỏi và nói cho bạn bè mình về điều đó. Google thực hiện khoảng 10.000 câu hỏi một ngày. Có những lúc, nó chiếm đến một nửa công suất Internet của Stanford. Cơn thèm thiết bị và băng thông rộng của nó ngày càng mãnh liệt. “Chúng tôi cầu xin và vay mượn,” Page kể. “Có hàng tấn máy tính xung quanh và chúng tôi xoay xở để có được vài chiếc.” Phòng ký túc của Page, về bản chất, là trung tâm hoạt động của Google, với một mớ hỗn độn các loại máy vi tính từ các nhà sản xuất khác nhau, nhồi nhét trong một phiên bản giá đặt máy chủ tự làm – một khoang chứa lắp ghép. Larry và Sergey thường lang thang quanh bãi đỗ để xem ai trong trường sắp nhận được máy – các công ty như Intel và Sun cho Stanford rất nhiều máy móc miễn phí để dụ dỗ các nhân viên tương lai – và rồi cặp đôi này sẽ hỏi những người được nhận máy xem họ có thể chia sẻ tí chút phần thưởng đó được không.
Như thế vẫn chưa đủ. Để lưu được hàng triệu trang đã mày mò được, cặp đôi đã phải tự mua các ổ đĩa có dung lượng lớn. Page, người có biệt tài tận dụng từng xu, đã tìm được một nơi bán đĩa được tân trang lại với giá rẻ – bằng 1/10 giá gốc – đến nỗi rõ ràng là phải có vấn đề gì đó với mấy cái đĩa này. “Tôi tìm hiểu và phát hiện ra rằng chất lượng của chúng sẽ ổn miễn là bạn thay thế hệ thống hoạt động [của đĩa],” anh kể. “Chúng tôi có 120 ổ, mỗi ổ khoảng 9 GB. Tức là có khoảng 1 TB(11) chỗ chứa.” Đó là phương pháp mà sau này Google ứng dụng để xây dựng cơ sở hạ tầng với chi phí thấp.
Larry và Sergey sẽ ngồi trước màn hình, quan sát các lệnh tìm kiếm – những lúc cao điểm nhất thì mỗi giây lại có thêm một lệnh mới – và rõ ràng là họ cần thêm thiết bị. Tiếp theo sẽ là gì?, họ tự hỏi.
https://thuviensach.vn
Stanford không bắt họ phải rời đi – sự rắc rối của việc vận hành một Google mới mọc ra được bù đắp bằng niềm tự hào rằng một điều thật thú vị đang hình thành trong bộ môn. “Không phải là ánh hào quang của chúng tôi bị lu mờ đi khi họ vận hành bọ tìm kiếm,” Garcia-Molina, người vẫn hy vọng rằng Larry và Sergey sẽ phát triển công trình của mình theo hướng hàn lâm, nói, “Tôi nghĩ nó sẽ tạo thành một lý thuyết vĩ đại. Tôi cho là gia đình họ cũng ủng hộ họ lấy bằng tiến sĩ. Nhưng thành lập một công ty thì lại là một sự hấp dẫn khó lòng cự tuyệt.”
Không có phương án nào khác; không ai trả đủ cho Google. Sau nhiều năm mơ mộng về việc làm sao những ý tưởng của mình có thể thay đổi thế giới, Larry Page nhận ra rằng anh đã làm được một vài việc có thể tạo ra những thay đổi đó. “Nếu công ty thất bại, quá tệ,” Page nói. “Chúng tôi thực sự sẽ làm được điều gì đó thực sự có ý nghĩa.”
Họ quay lại với Dave Cheriton, người khuyến khích họ vào cuộc. “Tiền không nên là vấn đề,” anh nói. Cheriton gợi ý họ nên gặp Andy Bechtolsheim. Brin thảo nhanh một bức thư điện tử cho Bechtosheim, gửi vào khoảng nửa đêm hôm đó và ngay lập tức nhận được thư hồi đáp hỏi xem hai cậu sinh viên có thể có mặt lúc 8 giờ sáng hôm sau tại nhà của Cheriton được không, Bechtolsheim vẫn thường đi làm vào giờ đó mỗi ngày. Vào cái giờ phiền phức đó, Page và Brin chạy thử công cụ tìm kiếm của mình cho Bechtolsheim xem trên hiên nhà Cheriton, ở đó có cổng kết nối mạng. Bechtolsheim, ấn tượng nhưng còn vội đi làm, nhanh chóng dừng cuộc gặp bằng cách đưa ra đề nghị viết một tấm séc trị giá 100.000 đôla cho cặp đôi.
“Chúng tôi chưa có tài khoản ngân hàng,” Brin nói.
“Gửi vào lúc nào các anh có,” Bechtolsheim nói, lao vội vào chiếc Porsche. Với một hành động đơn giản như thể đang quơ nhanh một ly cà phê sữa trên đường đi làm, ông vừa tạo ra một doanh nghiệp sẽ thay đổi cách cả thế giới tiếp cận thông tin. Brin và Page ăn mừng bằng một bữa sáng tại Burger King. Tấm séc nằm lại trong phòng ký túc của Page một tháng trời.
https://thuviensach.vn
Không lâu sau đó, những nhà đầu tư cá nhân khác đã cùng tham gia với Bechtolsheim, trong đó có Dave Cheriton. Một người nữa là doanh nhân của Thung lũng Silicon tên là Ram Shriram, công ty của ông này khi đó mới được Amazon.com mua lại. Shriram đã gặp Brin và Page hồi tháng 2 năm 1998; mặc dù không thực sự tin tưởng vào mô hình kinh doanh công cụ tìm kiếm, ông đã ấn tượng với Google đến mức không ngừng quảng cáo về nó. Sau cuộc gặp gỡ với Bechtolsheim, Shriram mời họ tới nhà mình để gặp cấp trên của ông, Jeff Bezos, người đã bị mê hoặc trước đam mê của họ cũng như “sự bướng bỉnh lành mạnh” khi họ giải thích vì sao họ sẽ không bao giờ đặt các quảng cáo nổi bật trên trang chủ của mình. Bezos tham gia cùng Bechtolsheim, Cheriton và Shriram với tư cách nhà đầu tư, góp thành tổng cộng một triệu đôla tiền vốn.
Ngày 4 tháng 9 năm 1998, Page và Brin nộp đơn thành lập công ty và cuối cùng cũng chuyển khỏi khuôn viên trường. Bạn gái của Sergey có người chị đang làm việc tại Intel tên là Susan Wojcicki, Susan cùng chồng vừa mua một ngôi nhà trên đường Santa Margarita ở Công Viên Menlo với giá 615.000 đôla. Để kiếm tiền trả 5 .góp, đôi vợ chồng cho Google thuê lại gara và vài căn phòng trong nhà với giá 1.700 đôla một tháng. Đó là thời điểm họ thuê nhân sự đầu tiên, một sinh viên cùng trường Stanford, Craig Silverstein. Anh ta tạo được mối dây liên kết với họ là nhờ việc hứa hẹn sẽ chỉ cho họ cách nén tất cả các đường dẫn mà họ đã tìm được để chúng có thể được lưu vào bộ nhớ và chạy nhanh hơn (“Chủ yếu là để tôi đặt được chân qua ngưỡng cửa”, anh kể lại.) Họ cũng thuê một quản lý văn phòng đồng thời duy trì sự có mặt tại trường Stanford mùa thu năm ấy, cùng dạy một khóa học, CS 349, “Khai thác dữ liệu, Tìm kiếm và Mạng toàn cầu,” lớp này học hai buổi một tuần vào học kỳ đó. Brin và Page loan tin về khóa học đó là một “lớp học dự án”, ở đây các sinh viên sẽ làm việc với một kho chứa 25 nghìn trang web mà họ đã thu thập được. Họ thậm chí còn có cả một trợ lý nghiên cứu. Bài đọc được giao về đầu tiên chính là bài báo của họ, nhưng đến giai đoạn sau của học kỳ thì lớp học lại rất sốt sắng với việc so sánh giữa PageRank và công trình của Kleinberg.
https://thuviensach.vn
Tháng 12, sau khi những dự án cuối cùng được hoàn thành, Page gửi thư mời dự tiệc cho các sinh viên, bức thư đó cũng đã ghi lại một dấu mốc: “Dự án Nghiên cứu Stanford bây giờ là Google.com: Công ty Tìm kiếm trên Internet Thế hệ mới (The Next Generation Internet Search Company”.
“Trang phục thì theo phong cách đồ mặc ở nhà,” thư mời nói rõ, “và nhớ mang tới cái gì đó để xài với bồn tắm nước nóng.”
2.
“Chúng tôi muốn Google thông minh được như bạn.”
Larry Page không muốn kết thúc như Tesla. Google đã nhanh chóng trở thành chương trình yêu thích của tất cả những ai sử dụng nó để tìm kiếm trên mạng. Nhưng ban đầu thì AltaVista cũng thế và công cụ tìm kiếm đó đã không phát triển thành công. Vậy thì Google, dưới sự dẫn dắt của hai cậu trai trẻ tài năng nhưng thiếu kinh nghiệm, sẽ xoay xở thế nào trước những vấn đề vô cùng khó nhằn để cải thiện dịch vụ của mình đây?
“Nếu năm sau mà chúng tôi không tốt hơn hẳn, chắc chắn chúng tôi sẽ rơi vào quên lãng,” Page nói với một trong những phóng viên đầu tiên đến thăm công ty.
Mạng lan nhanh như sắn dây. Người ta đua nhau vào Google. Kế hoạch của Google là tăng lưu lượng truy cập vào webstie hơn nữa. “Khi bắt đầu công ty, chúng tôi có hai chiếc máy tính,” Craig Silverstein kể. “Một chiếc là dịch vụ mạng, chiếc kia làm tất cả những việc còn lại – xếp hạng trang, tìm kiếm. Và đằng sau máy tính là cả một chuỗi dài bất tận những chiếc đĩa lưu trữ đến 25 triệu trang web. Rõ ràng là như vậy thì không được cân bằng lắm.” Kiếm thêm máy tính không phải vấn đề. Google cần sức mạnh tư duy, nhất là vì Brin và Page đã chạm ngưỡng giới hạn của mình trong việc
https://thuviensach.vn
viết phần mềm cho phép công cụ tìm kiếm phát triển và đi lên. “Mã hóa không phải là lĩnh vực yêu thích của họ,” Silverstein nói.
Các nhà sáng lập cũng biết rằng Google phải thông minh hơn rất nhiều mới có thể tiếp tục làm hài lòng người dùng – cũng như để thỏa mãn tham vọng thay đổi thế giới của họ. “Chúng tôi không phải lúc nào cũng làm ra những thứ mà mọi người muốn,” Page giải thích trong những ngày đầu tiên của Google. “Như thế rất khó. Để làm được điều đó bạn phải thật thông minh – bạn phải hiểu tất cả mọi điều trên thế giới. Trong khoa học máy tính, chúng tôi gọi đó là trí thông minh nhân tạo.”
Brin hùa vào: “Chúng tôi muốn Google phải thông minh như bạn – bạn nên có được câu trả lời ngay vào giây phút bạn nghĩ ra câu hỏi.” “Một công cụ tìm kiếm tốt nhất, tân tiến nhất,” Page nói. “Chúng tôi còn cách nó một quãng xa.”
Page và Brin đều giữ một niềm tin cốt lõi là thành công của công ty họ phụ thuộc hoàn toàn vào việc có được các kỹ sư và nhà khoa học tầm cỡ thế giới nguyện cống hiến cho tầm nhìn đầy tham vọng của họ. Page tin rằng các công ty công nghệ chỉ có thể vươn lên nhờ “một hiểu biết ở tầm cao nhất về khoa học công nghệ.” Bằng cách nào đó, Page và Brin phải tìm ra được một nhóm như vậy và tạo đủ ấn tượng để họ muốn tham gia vào một công ty khởi nghiệp nhỏ bé. Ồ, và họ có một chính sách giúp thu hẹp phạm vi: Không có những người khó chịu. Họ đã nghĩ ngay đến văn hóa công ty mình và đảm bảo rằng những người họ tuyển sẽ thể hiện những phẩm chất như thông minh sắc sảo, hướng tới người dùng và sáng ngời lý tưởng.
“Chúng tôi chỉ tuyển những người giống mình,” Page nói. Một số nhân viên ban đầu của Google chỉ là các sinh viên sắp tốt nghiệp có tài, những người như Marissa Mayer, một thiên tài toán học cần cù và một vũ công ba-lê tại trường trung học của cô ở Wausau, Wisconsin, người đã trở thành một ngôi sao trí thông minh nhân tạo của Stanford. (Trong buổi phỏng vấn của cô với Silverstein, cô được hỏi về ba điều mà Google
https://thuviensach.vn
có thể làm tốt hơn; 10 năm sau, cô vẫn còn giận mình vì chỉ liệt kê được ra có hai điều.) Nhưng Page và Brin còn theo đuổi cả những người có hồ sơ hay xuất hiện ở các văn phòng tuyển dụng của Microsoft Research hay bộ môn Khoa học máy tính của Carnegie Mellon nữa. Một trong những phi vụ táo bạo đầu tiên của họ là với một vị giáo sư của Đại học California ở Santa Barbara tên là Urs Hölzle. Ông đã từng tìm hiểu loạt công cụ tìm kiếm trước đó như AltaVista và Inktomi để rồi kết luận rằng, với tư cách là một nhà khoa học máy tính đã quen thuộc với ngôn ngữ lập trình Boolean và các kỹ thuật khác, ông có thể sử dụng các kỹ thuật này để tìm được những gì mình muốn trên mạng. Nhưng mẹ ông thì không bao giờ có thể sử dụng được các kỹ thuật này. Google ngay lập tức thay đổi cách nghĩ của ông về việc đó: Bạn chỉ cần gõ điều bạn muốn vào máy và, bùm, kết quả đầu tiên đã hợp lý rồi. Mẹ sẽ thích điều này lắm! “Dường như họ biết chắc chắn là mình đang làm gì,” ông nói về Larry và Page.
Quan trọng hơn, khi tới thăm công ty mới vào đầu năm 1999, ông đã hiểu ra rằng dù mình không có chút nền tảng nào trong lĩnh vực tìm kiếm thông tin nhưng những vấn đề mà Brin và Page đang tìm cách giải quyết có rất nhiều điểm chung với công việc của ông trong những hệ thống máy tính lớn. Công cụ tìm kiếm nhỏ xinh này đang lao vào những vấn đề về hiệu quả hoạt động và tính khả mở (khả năng nâng cao năng lực tính toán cho máy tính) mà trước đây chỉ có các dự án lớn mới dám thử. Đó chính là vũ khí bí mật của Google để lôi kéo các nhà khoa học máy tính tầm cỡ thế giới: Trong một thế giới nơi các phòng thí nghiệm của doanh nghiệp đang dần đóng cửa, công ty khởi nghiệp nhỏ bé này đưa ra một cơ hội để tạo nên những đột phá trong ngành khoa học máy tính.
Hölzle, rất thận trọng, chấp nhận lời đề nghị nhưng vẫn giữ vị trí của mình tại Đại học California bằng cách xin tạm nghỉ một năm. Nhưng sau đó, ông không bao giờ trở lại. Tháng 4, ông tới Google cùng chú chó Leonberger lông xù tên là Yoshka lẽo đẽo theo sau. Ông ngay lập tức ngụp lặn để giúp Google vượt qua tình trạng hạ tầng bị quá tải. (Tới lúc đó, Google đã chuyển khỏi ngôi nhà Wojcicki ở khu Công viên Menlo tới một
https://thuviensach.vn
văn phòng hai tầng phía trên một cửa hàng xe đạp ở trung tâm Palo Alto.) Mặc dù lúc này Google đã có trong tay một trăm máy tính – công ty mua máy tính nhanh hết sức có thể – nhưng nó chưa thể giải quyết được khối lượng các lệnh tìm kiếm. Có đến hàng trăm nghìn lệnh một ngày được nhập vào hệ thống.
Thời gian tìm kiếm trung bình tại thời điểm đó, Hölzle nhớ lại, mất khoảng ba giây rưỡi. Vì tốc độ là một trong số các giá trị cốt lõi của Page và Brin nên đây chính là nguồn gốc đau khổ cho những người sáng lập. “Về cơ bản, chúng tôi đã hoạt động hết công suất trong những giai đoạn cao điểm của mỗi ngày,” Hölzle nói. “Không có vấn đề gì xảy ra đối với người sử dụng. Vấn đề nằm ở khả năng tăng trưởng, các cải tiến hoạt động.” Vấn đề này một phần là do Page và Brin đã viết (viết mã nguồn) hệ thống bằng thứ mà Hölzle gọi là “mã đại học”, một cách văn hoa khi nói về những tay nghiệp dư. “Máy chủ không thể xử lý nhiều hơn 10 yêu cầu (request) trong một giây vì nó được viết bằng Python, một ý tưởng tuyệt vời đối với một hệ thống dùng để nghiên cứu nhưng không phải là một giải pháp có hiệu suất cao,” ông nói. Ông ngay lập tức bắt tay viết lại chỗ mã đó.
Cùng làm với việc Hölzle còn có một số nhà khoa học máy tính khác, những người táo bạo hơn trong việc quyết định trở thành nhân viên chính thức của Google. Trong số này có cả các kỹ sư từ bộ phận nghiên cứu của DEC. Huyền thoại bắt đầu từ Thung lũng Silicon với cái tên Trung tâm nghiên cứu Palo Alto (PARC) thuộc Xerox, một phòng nghiên cứu kinh điển đầy ắp sự đổi mới mang tính đột phá, nhưng lại bị hiểu nhầm, chôn vùi hoặc nói cách khác bị hủy hoại bởi công ty mẹ thiếu hiểu biết. (Các phát minh của nó bao gồm cả giao diện máy tính hiện đại với các cửa sổ (window) và các thư mục chứa tập tin (fi le folder). Nhưng sau khi các cơ hội bị bỏ lỡ, PARC chẳng còn lại gì tại Phòng thí nghiệm nghiên cứu phía Tây của DEC, nơi này về sau bị chuyển cho Compaq khi công ty máy tính cá nhân đó mua lại Digital Equipment Corporation năm 1998. (Năm 2002, Hewlett- Packard mua lại Compaq). Trong năm 1998, hai năm trước khi
https://thuviensach.vn
Apple bắt đầu nghiên cứu iPod, các kỹ sư của DEC lúc đó đã đang phát triển một máy nghe nhạc điện tử có thể chứa nguyên một bộ sưu tập âm nhạc và có kích thước vừa với túi của bạn. Hơn nữa, DEC còn có một vài cha đẻ của Internet, cũng như các nhà khoa học viết những bản nghiên cứu đầu tiên về học thuyết mạng. Nhưng DEC chưa bao giờ sử dụng ý tưởng đến từ các kỹ sư của mình để giúp phát triển AltaVista trở thành Google. (“Từ khoảnh khắc tôi rời khỏi DEC, tôi không bao giờ sử dụng lại AltaVista,” Louis Monier, người đã rời đi năm 1998, nói. “Nó đơn giản là thảm hại. Hoàn toàn hiển nhiên là Google tốt hơn.”) Nên gần như chả có gì phải băn khoăn khi một vài người trong số họ đến với Google. “Số lượng [các cựu chuyên gia của DEC làm việc tại Google] thật sự là thứ có thể gây choáng,” Bill Weihl, một người tị nạn từ DEC chuyển đến công ty này năm 2004, cho biết.
Một trong số các kỹ sư DEC đó đã độc lập khám phá ra sức mạnh của các kết nối web trong tìm kiếm. Jeffray Dean băn khoăn không biết liệu một chương trình phần mềm có thể hướng người sử dụng web đến các trang có liên quan tới những thứ mà họ thích hay không. Theo cách nhìn của ông, bạn sẽ đọc một bài báo trên New York Times và chương trình của ông sẽ nhảy ra (pop-up) và hỏi bạn có muốn xem mười trang hay ho khác có liên quan đến nội dung mà bạn đang đọc không.
Tháng 2 năm 1999, Dean đã rời DEC để gia nhập một công ty mới khởi nghiệp có tên là mySimon. Dù vậy, trong vài tháng, ông thấy buồn chán. Sau đó ông biết được rằng Urs Hölzle đã gia nhập nhóm những người làm ra PageRank. “Tôi đã tính toán rằng Google hẳn sẽ là một lựa chọn tốt hơn vì tôi biết nhiều người ở đó hơn và họ có vẻ như là am hiểu kỹ thuật hơn,” ông nói. Ông đã phấn khích đến nỗi mặc dù thời gian chính thức bắt đầu của ông là tháng 8 năm 1999 nhưng từ tháng 7, ông đã bắt đầu đến Google sau khi kết thúc công việc hàng ngày tại mySimon.
Bộ phận tuyển dụng của Dean bắt đầu chú ý tới một nhà nghiên cứu khác của DEC, Krishna Bharat. Anh ta cũng từng suy nghĩ về các cách thức nhận kết quả tìm kiếm web từ các kết nối. Bharat lúc đó đang nghiên cứu
https://thuviensach.vn
một thuật toán có tên là Hilltop, nó xác định theo thuật toán các “expert sites” (trang chuyên nghiệp) và sử dụng chúng để chỉ đến các kết quả chính xác nhất bằng cách đi thẳng đến đại diện của website đó – các kết nối và một số bit từ các trang con – được lưu trữ trên bộ nhớ máy tính. Các thuật toán của Bharat sẽ đi loanh quanh “họ hàng của truy vấn này” để tìm ra các trang quan trọng.
Nhà khoa học máy tính sinh tại Ấn Độ này đã nằm trong tầm ngắm của Google: Khi ăn trưa tại một hàng rong có tên là World Wraps tại Palo Alto, anh ta gặp Sergey Brin, người như thường lệ sẽ đưa danh thiếp và thôi thúc anh xin tuyển vào Google. Bharat có ấn tượng với Google. Nhưng Google quá nhỏ. Rất khó để Bharat nghĩ đến việc rời khỏi những điều kiện tiện nghi của một công ty lớn để đến một công ty nhỏ với lực lượng lao động có một chữ số như Google. Hơn nữa, anh ta ấp ủ khả năng theo đuổi việc nghiên cứu, điều mà anh ta không biết liệu có thể thực hiện được ở một công ty mới khởi nghiệp hay không.
Sau đó Google đã thuê Jeff Dean và Bharat đã bị choáng. Chuyện này giống như việc một đội bóng rổ chơi ở một giải đấu nhỏ ít người biết kiếm được một cầu thủ thuộc loại hàng đầu ở NBA(12). Rất nhanh sau đó, Bharat biết được rằng cái công ty khởi nghiệp mới thành lập này, thậm chí còn khó có thể đáp ứng được lưu lượng truy vấn của nó, đang bắt đầu hình thành một nhóm nghiên cứu! Nghe giống như một câu chuyện hoang đường, nhưng Bharat quyết định tham gia phỏng vấn. Anh nói thẳng quan điểm rằng mình không tin lắm vào sự thành công của các tham vọng nghiên cứu của Google. “Larry, tại sao cậu lại nói rằng cậu muốn làm nghiên cứu?”, anh ta hỏi Page. “Cậu giống như một tập hợp nhỏ xíu!” Câu trả lời của Page bất ngờ và ấn tượng. Nhìn sự việc từ một góc độ khác có thể dẫn đến những giải pháp không ngờ tới, Page nói. Trong kỹ thuật, đôi khi bạn nhìn mọi thứ với tầm nhìn kiểu đường hầm và cần một góc nhìn rộng lớn hơn. Anh kể cho Bharat câu chuyện về việc một nhân viên thuộc bộ phận nghiên cứu của hãng Kodak đã bất ngờ can thiệp và giúp hãng giải quyết được một
https://thuviensach.vn
vấn đề có vẻ như khó khắc phục như thế nào. Page muốn sự việc kiểu đó xảy ra tại Google.
Tác động đó đã bán đứng Bharat. Một chàng trai trẻ, thiếu kinh nghiệm sống và hơi nhút nhát – nhưng hiểu sâu về kỹ thuật và rất tự tin. “Tôi có thể tôn trọng Larry theo cách mà tôi không thể dùng để tôn trọng những người điều hành các công ty khởi nghiệp khác”, Bharat nói. “Tôi biết nội dung kỹ thuật trong công việc của anh ta”. Hơn nữa, Bharat có thể cảm thấy sức hút trong chiến dịch nhằm làm thế giới tốt đẹp hơn bằng cách đập vỡ các vấn đề khó khăn tại giao điểm của khoa học máy tính và trừu tượng của Page. Bharat đã nghĩ nhiều về nghiên cứu và say mê với các bí ẩn của nó. Nếu nhìn từ bên ngoài, mọi thứ có vẻ dễ dàng đến trêu ngươi. Nhưng mọi người chỉ nắm được phần nhỏ nhất về khả năng của nó. Để có thể tiến bộ, thậm chí sống trong không gian này, bạn sẽ phải sống trong dữ liệu đó, hít thở chúng như cá thải nước qua mang. Đây là lời mời của anh ta. Bharat cuối cùng sẽ làm một cuộc cách mạng cho thuật toán Hilltop của mình, được gọi là phân tích tính kết nối của web, trong bộ máy tìm kiếm của Google. Nó sẽ là bằng sáng chế đầu tiên của công ty này.
Lần tuyển dụng ấn tượng tiếp theo của Google là vào đầu năm 2000: Anurag Acharya, một chuyên gia ở Santa Barbara, từng là đồng nghiệp của Hölzle. Acharya, nhận bằng Tiến sĩ tại Đại học Carnegie Mellon, dành cả đời mình trong giới hàn lâm, nhưng ở tuổi 36 anh bắt đầu đặt dấu hỏi về sự tồn tại của mình ở đó. Anh mệt mỏi với thứ công việc lệ thường, theo đó mọi người tiếp nhận một vấn đề có phạm vi hạn chế, xử lý nó, báo cáo kết quả, và sau đó lại tiếp tục với một vấn đề khác. Anh nhớ lại khi còn là sinh viên và ngồi nói chuyện với người tư vấn của mình, một nhà tư tưởng sâu sắc đã dành cả cuộc đời để vật lộn với một bí mật to lớn duy nhất: Bản chất của ý thức là gì? Dần dần, Acharya cho rằng việc vật lộn với một vấn đề cổ điển khó nhằn mà nó sẽ vẫn tồn tại sau khi bạn rời khỏi trái đất là một việc rất hấp dẫn. Nói chuyện với Hölzle trong suốt cuộc phỏng vấn vào công ty nhỏ bé này, anh nhận ra nghiên cứu chính là loại vấn đề như thế. “Tôi không có kinh nghiệm trong nghiên cứu nhưng đang tìm kiếm một vấn đề
https://thuviensach.vn
đại loại như vậy,” anh nói. “Có lẽ đây chính là vấn đề gây tranh tôi đang tìm kiếm.” Thêm một điểm hấp dẫn với Google chính là nguồn gốc của anh – giống như nhiều đồng nghiệp mới khác của mình, anh ta đến từ một bang của Ấn Độ. (Và giống như nhiều người khác tại Google, bao gồm cả những người sáng lập, bố mẹ anh ta đều là học giả). Anh thường nghĩ đến mọi người ở quê nhà, những người không chỉ nghèo khó mà còn thiếu thốn thông tin. “Nếu bạn thành công tại Google, mọi người ở bất kỳ đâu đều có thể tìm kiếm thông tin,” anh nói.
Bharat đề cử một người bạn khác là Ben Gomes, làm việc tại Sun. Gomes gia nhập Google cùng một tuần với Bharat. Và Bharat có một người bạn khác, một trong số những phi vụ thâu tóm có chất lượng nhất từng có: Amit Singhal.
Singhal sinh ra tại Ấn Độ. Năm 1992, anh sang Hoa Kỳ để theo đuổi bằng Thạc sĩ về khoa học máy tính tại trường Đại học Minnesota. Anh bắt đầu hứng thú với một lĩnh vực có tên là thu thập thông tin và khao khát được nghiên cứu cùng với người tiên phong sáng tạo ra lĩnh vực đó, Gerard Salton. “Tôi chỉ nộp đơn vào một trường, và đó là Cornell,” anh nói. “Và tôi từng viết trong phần khai lý do của mình rằng nếu tôi có được bằng Tiến sĩ, đó sẽ là cùng với Gerry Salton. Nếu không, tôi nghĩ bằng Tiến sĩ không có giá trị gì.” Anh trở thành trợ lý của Salton, nhận được bằng Tiến sĩ tại Cornell, và cuối cùng thích thú với Phòng thí nghiệm AT&T.
Năm 1999, Singhal tình cờ gặp Bharat trong buổi hội thảo tại Berkeley. Bharat nói rằng anh ta có ý định rời DEC để đến một công ty mới khởi nghiệp hay ho đang có tham vọng xử lý các vấn đề lớn nhất trong nghiên cứu. Công ty đó có cái tên vui nhộn: Google. Singhal cũng nên tới đó làm việc. Singhal đã nghĩ ý tưởng đó thật hài hước. Có lẽ nó phù hợp với Bharat, một người trẻ hơn anh vài tuổi và chưa lập gia đình.
Nhưng Singhal đã có vợ và con gái, vợ anh lại đang mang bầu đứa thứ hai. “Những công ty nhỏ này sẽ chẳng đi đến đâu cả,” anh ta nói. “Tôi làm việc cho AT&T - Con tàu lớn này luôn ra khơi. Tôi không thể chuyển đến cái công ty Google gì gì đó vì tôi còn phải nuôi gia đình.”
https://thuviensach.vn
Không lâu sau đó, con tàu lớn AT&T bắt đầu đắm. “Năm 2000, tôi đã đến đây”, Singhal nói.
Gần một năm kể từ khi Brin và Page thành lập công ty của mình, họ đã tập hợp một nhóm các nhà khoa học hàng đầu, hoàn toàn ủng hộ tầm nhìn của những người sáng lập. Những nhân viên ban đầu này sẽ là một phần trong các nỗ lực của đội, liên tiếp đưa ra các sáng kiến, thứ mở rộng đường để Google vượt lên trên các đối thủ của nó và trở thành một từ đồng nghĩa với tìm kiếm. Nhưng những đột phá đó là tương lai sau này. Năm 2000, những bộ não lớn đó đã tập trung trong một phòng hội thảo để xử lý khẩn cấp một vấn đề về cơ sở hạ tầng. Google gặp tình huống xấu.
Vấn đề này là do chỉ mục lưu trữ các nội dung thuộc về trực tuyến trên các server của Google. Trong vài tháng đầu năm 2000, nó không cập nhật chút nào. Hàng triệu tài liệu được tạo trong thời gian đó đã không được thu thập. Đối với công cụ tìm kiếm Google, chúng không tồn tại.
Vấn đề nằm ở một lỗi trong tiến trình thu thập (crawling) và lập chỉ mục (indexing). Nếu một trong các máy dùng cho việc thu thập bị hỏng trước khi quá trình được hoàn thành, việc lập chỉ mục phải bắt đầu lại từ đầu. Nó giống như một trò chơi nhập vai trên máy tính mà bạn phải dành hàng trăm giờ để xây dựng một nhân vật và rồi toàn bộ công sức của bạn sẽ thành công cốc nếu nhân vật của bạn bị hạ bởi một con thú lạc hoặc kẻ thù có vũ trang. Thế giới trò chơi đã học được cách giải quyết vấn đề này – các hình đại diện đã chết có thể được hồi sinh sau một khoảng ngừng ngắn hoặc một lần chuyển chỗ phiền hà. Nhưng Google thì chưa.
Lỗi đó không ảnh hưởng nhiều lắm trong những ngày đầu của Google, khi họ chỉ cần dùng khoảng 5 máy cho việc thu thập và lập chỉ mục mạng. Tuy nhiên, khi mạng tiếp tục phát triển, Google bổ sung thêm máy móc – vào thời điểm cuối năm 1999, có 80 máy tham gia việc thu thập (trong tổng số khoảng 3.000 máy tính thuộc sở hữu của Google vào thời điểm đó) – và khả năng xảy ra rủi ro tăng lên đáng kể. Đặc biệt kể từ khi Google coi việc mua những thứ thiết bị bị coi là “rẻ tiền” là cần thiết. Thay vì các thiết bị
https://thuviensach.vn
được xử lý và kiểm duyệt thông tin, Google sẽ mua các mẫu hàng tiêu dùng được giảm giá và chưa được lắp ráp để bảo vệ tính toàn vẹn của dữ liệu. Về phần giải pháp tạm thời, các kỹ sư triển khai sắp xếp để dữ liệu chỉ mục được lưu trữ trên các ổ cứng khác nhau. Nếu một máy không ổn, máy nhắn tin của mọi người sẽ vang lên, thậm chí là vào nửa đêm và họ sẽ đổ xô vào phòng làm việc đó để ngay lập tức dừng việc thu thập, sao chép lại dữ liệu và thay đổi các fi le cấu hình. “Cứ vài ngày, việc này lại xảy ra một lần, và về cơ bản thì nó dừng mọi thứ lại, rất tốn sức”, Sanjay Ghemawat, một trong số các thầy phù thủy nghiên cứu của DEC đã gia nhập Google, nói.
“Chúng ta cần xem xét lại toàn bộ,” Jeff Dean nói.
Thực tế là cần phải làm lại, vì từ năm 2000, các yếu tố cản trở việc thu thập phiền hà đến mức mà dù đã rất nỗ lực nhưng có vẻ như Google sẽ không bao giờ xây dựng được chỉ mục tiếp theo của nó.
Mạng phát triển với tốc độ đáng kinh ngạc, với hàng tỷ tài liệu tăng lên mỗi năm. Sự xuất hiện của một công cụ tìm kiếm như Google thực tế đã thúc đẩy tốc độ này, khích lệ mọi người rất nhiều khi họ khám phá ra rằng thậm chí mẩu thông tin khó tìm nhất cũng có thể tiếp cận bởi một lượng nhỏ những người đánh giá cao nó. Google đang cố gắng đón cơn sóng thần này bằng cách trang bị nhiều máy hơn – những máy móc rẻ tiền, do đó gia tăng khả năng bị hỏng. Các cập nhật sẽ có tác dụng trong một thời gian ngắn, sau đó bị lỗi. Và bây giờ, rất nhiều tuần đã trôi qua, các chỉ mục vẫn chưa được cập nhật.
Rất khó để có thể đánh giá hết sự nghiêm trọng của vấn đề này. Một trong số các yếu tố quan trọng của tìm kiếm tốt là sự cập nhật – đảm bảo rằng các chỉ mục có kết quả gần đây nhất. Thử tưởng tượng nếu các thông tin được cập nhật một năm sau khi xảy ra sự kiện. Ví dụ, cuộc khủng bố 11 tháng 9 năm 2001. Làm một tìm kiếm trên Google về “Trung tâm Thương mại Thế giới” (World Trade Center) vào tháng 11 hoặc 12, bạn sẽ chả tìm thấy kết nối nào về sự kiện này. Thay vào đó, bạn sẽ có các kết quả gợi ý về
https://thuviensach.vn
một trải nghiệm bữa tối tinh tế trên các Cửa sổ của Thế giới, tại tầng 107 của Tòa nhà Phía Bắc hiện không còn tồn tại.
Nửa tá kỹ sư đã chuyển các máy tính của họ vào một phòng họp. Từ đó, Google đã tạo ra phòng trực chiến đầu tiên của mình. (Thời điểm sau đó – gần một năm sau khi chuyển từ căn nhà tại công viên Menlo đến văn phòng tại khu thương mại Palo Alto – Google lại di chuyển một lần nữa, đến một cơ sở có khuôn viên văn phòng rộng hơn, tại đường Bayshore gần Mountain View. Các nhân viên gọi nó là Googleplex, một cách chơi chữ từ thuật ngữ toán học googolplex, nghĩa là một số lớn không tưởng.) Khi mọi người bắt đầu làm việc, họ sẽ đi đến phòng trực chiến thay vì phòng làm việc. Và họ sẽ thức khuya. Dean đã ở đó cùng với Craig Silverstein, Sanjay Ghemawat và một vài người khác.
Họ xây dựng một hệ thống ứng dụng “đánh dấu điểm”, một cách để chỉ mục lưu giữ vị trí của nó nếu tai họa rơi xuống một máy chủ hoặc ổ cứng. Nhưng hệ thống mới này còn đi xa hơn – nó sử dụng một cách thức khác để xử lý một nhóm ổ cứng, giống kiểu xử lý song song trong điện toán (nơi mà một nhiệm vụ tính toán sẽ được phân chia ra nhiều máy tính hoặc bộ xử lý) hơn là công nghệ “phân mảnh” (sharding) mà Google từng sử dụng, nó sẽ phân chia mạng và gán các khu vực của nó cho các máy tính đơn lẻ. (Những người quen với các thuật ngữ máy tính có thể biết đến công nghệ này là “partitioning” (phân chia), nhưng, theo Dean thì, “mọi người tại Google gọi nó là phân mảnh vì nó nghe hay hơn.” Đối với các thầy phù thủy về cơ sở hạ tầng của Google, nó là thuật ngữ chủ chốt).
Thí nghiệm này dẫn đến một cải tạo đầy tham vọng về cách thức mà toàn bộ cơ sở hạ tầng của Google xử lý các tập tin. Ghemawat nói: “Tôi luôn muốn xây dựng một hệ thống các tập tin. Và rõ ràng là chúng tôi sẽ phải làm việc này. Ý tưởng chủ yếu là chúng tôi muốn hệ thống tập tin đó tự động xử lý với các hỏng hóc và để làm như vậy nó sẽ phải lưu trữ nhiều bản sao và tạo ra các bản sao mới khi bản sao nào đó bị lỗi.”
Một sự đổi mới khác, xuất hiện muộn hơn một chút, có tên là hệ thống in-RAM. Điều này bao gồm việc nhồi nhiều chỉ mục nhất có thể vào bộ
https://thuviensach.vn
nhớ thực tế của máy tính thay vì vào các ổ cứng chật chội và ít đáng tin cậy hơn. “Chỉ mục in-memory như là một yếu tố của hai hay ba cái rẻ hơn, vì tốc độ xử lý truy vấn trên mỗi máy của nó nhanh hơn rất nhiều”, Dean nói.
Hệ thống này biểu hiện bước tiếp cận của Google tới khoa học máy tính. Thực ra, chi phí cho một bộ nhớ cố định có thể cao đến mức việc sử dụng nó để lưu trữ Internet sẽ là một quan niệm gàn dở. Nhưng các kỹ sư của Google biết rằng tốc độ của công nghệ sẽ làm giảm giá thành và họ thiết kế phù hợp với hoàn cảnh. Cũng vậy, Google – như cái tên nó ngụ ý – được đẩy mạnh để xử lý việc mở rộng dữ liệu lịch sử mà cuộc cách mạng số gây ra. Các đối thủ cạnh tranh, đặc biệt là những đối thủ đã thành công trong thời kỳ trước đó, khá chậm chạp trong việc hoàn toàn chấp nhận hiện tượng này, trong khi Google coi nó bình thường như không khí. “Đơn vị của suy luận ở quanh đây là một terabyte”, Wayne Rosing, kỹ sư trưởng của Google năm 2003 nói. “Thậm chí là nó còn không thể trở nên hấp dẫn nếu không có nhiều terabyte hơn xuất hiện trong các vấn đề. Nên điều đó khiến bạn cuốn vào suy nghĩ về hàng trăm nghìn máy tính như là một cách chung để giải quyết các vấn đề.” Khi có nhiều sức mạnh để giải quyết các vấn đề, bạn không chỉ có khả năng giải quyết chúng nhanh hơn mà còn có thể làm nhiều hơn nữa, chẳng hạn như giải quyết các vấn đề thậm chí còn chưa từng được xem xét hay xây dựng các luận thuyết riêng cho mình.
Việc triển khai Google File System là một bước tiến về phía luận thuyết đó. Nó cũng là một sự phát triển hợp thời, vì các nhu cầu đối với hệ thống của Google sắp tăng lên một cách đột ngột. Google đã giành được một thỏa thuận về việc xử lý tất cả các lưu lượng tìm kiếm của Yahoo, một trong số các cổng thông tin lớn nhất trên mạng.
Thỏa thuận này – được công bố ngày 26/6/2000 – là bước phát triển bực bội đối với trưởng nhóm nghiên cứu của Yahoo, Udi Manber. Anh thường cho rằng Yahoo nên phát triển sản phẩm tìm kiếm riêng của mình, nhưng các ông chủ của anh không quan tâm. Thay vào đó, những nhà điều hành của Yahoo dành sự chú ý vào phát triển thương hiệu – các mánh lới tiếp thị, như là đưa ra logo màu hồng của công ty trên chiếc máy Zamobi được dùng
https://thuviensach.vn
để dọn tuyết trong khoảng thời gian giữa các trận hockey của đội San Jose Sharks. “Tôi có sáu người làm việc trong đội nghiên cứu của mình,” Manber nói. “Tôi không thể có được người thứ bảy. Đây là một công ty có hàng nghìn người. Tôi đã không thể có được người thứ bảy.” Kể từ khi Yahoo không có ý định phát triển nghiên cứu riêng của mình, Manber có nhiệm vụ kiếm đối tượng tốt nhất để mua bản quyền.
Sau khi thử nghiệm Google và vài lần đến thăm Larry Page, Manber đề nghị Yahoo sử dụng công nghệ của công ty này. Một nhượng bộ mà Yahoo cấp cho Google hóa ra là định mệnh: Trên các trang kết quả cho một tìm kiếm từ Yahoo, người sử dụng sẽ thấy một thông điệp thông báo rằng Google là người thực hiện việc tìm kiếm. Trang này thậm chí còn có logo Google. Do đó, hàng triệu người dùng Yahoo đã khám phá ra một công cụ tìm kiếm mà sẽ trở thành một phần trong cuộc sống của họ.
Trong bản thỏa thuận, Google đồng ý cập nhật chỉ mục của mình hàng tháng, điều này trở nên khả thi sau thí nghiệm trong phòng trực chiến. Lúc này, Google đã có thể tự hào rằng nó là chỉ mục lớn nhất với dữ liệu cập nhật nhất trong ngành công nghệ. Trong ngày thông báo thỏa thuận với Yahoo, Google báo cáo rằng các server của mình hiện đang giữ hơn một tỷ trang mạng. Hệ thống này tiếp tục là thứ hiện đại nhất cho đến hè năm 2003, khi Google mở ra một cuộc cải cách toàn bộ hệ thống chỉ mục để cho phép làm mới chỉ mục này theo từng ngày, thu thập các trang phổ biến thường xuyên hơn. Mật danh cho lần cập nhật năm 2003 là BART. Tiêu đề này ngụ ý rằng hệ thống của Google sẽ đạt được nguyện vọng (nếu không muốn nói là thành tựu) của hệ thống quá cảnh hàng loạt tại địa phương: “luôn đúng giờ, luôn nhanh chóng, luôn đúng kế hoạch”.
Mặc dù Google không bao giờ công bố thời điểm làm mới chỉ mục của mình nhưng mỗi khi nó thực hiện một thay đổi thì số lượng truy vấn trên toàn thế giới luôn tăng nhẹ, cứ như thể toàn thế giới nhận ra trong tiềm thức rằng có kết quả cập nhật hơn đang hiện hữu.
Phản ứng của người dùng Yahoo về công nghệ của Google, dù vậy, có lẽ là rõ ràng hơn. Họ để ý rằng việc tìm kiếm trở nên tốt hơn và sử dụng nó
https://thuviensach.vn
nhiều hơn. “Lưu lượng tăng lên đến khoảng 50% trong hai tháng,” Manber hồi tưởng lại việc chuyển dịch vụ tìm kiếm sang Google. Nhưng nhận xét duy nhất anh nhận được từ các nhà điều hành Yahoo là các phàn nàn rằng mọi người đang tìm kiếm quá nhiều và họ sẽ phải trả nhiều chi phí hơn cho Google.
Nhưng số tiền Google nhận được từ cung cấp dịch vụ tìm kiếm không phải khoản lợi nhuận lớn nhất. Giá trị lớn nhất mà công ty nhận được là cơ hội được tiếp cận với nhiều người sử dụng hơn và nhiều dữ liệu hơn. Chính dữ liệu sẽ đưa tìm kiếm của Google lên tầm cao mới. Thói quen tìm kiếm của người sử dụng, được nắm bắt và gói gọn trong các log có thể dùng để phân tích và khai thác, sẽ khiến Google trở thành cỗ máy học tập tối cao.
Amit Patel là người đầu tiên nhận ra giá trị các log của Google. Patel là một trong số những nhân viên đầu tiên của Google. Anh bắt đầu làm việc bán thời gian tại Google từ đầu năm 1999 trong khi vẫn tiếp tục lấy bằng tiến sĩ tại Stanford CS. Một trong số những dự án đầu tiên của anh tại Google hóa ra lại quan trọng hơn so với kỳ vọng của bất kỳ ai. Anh được yêu cầu “Đi tìm hiểu xem bao nhiêu người đang sử dụng Google, ai đang sử dụng nó và họ đang làm gì với nó”.
Nhiệm vụ đó thực sự hấp dẫn Patel, người mới chỉ bắt đầu tìm hiểu về các công cụ tìm kiếm và phân tích dữ liệu. Anh nhận ra rằng Google có thể là một thiết bị cảm biến rộng lớn về hành vi của con người. Ví dụ, anh để ý rằng các câu hỏi giúp làm bài tập về nhà thường tăng vọt vào các dịp cuối tuần. “Họ thường đợi đến tối Chủ Nhật để làm bài tập về nhà của mình, và sau đó họ tìm kiếm mọi thứ trên Google,” anh nói. Ngoài ra, bằng việc theo dõi xem những thông tin nào được tìm kiếm nhiều nhất trên Google, bạn có thể có được cái nhìn thoáng qua về thứ mà thế giới quan tâm trong thực tại. (Một vài năm sau, Patel sẽ đóng vai trò quan trọng trong việc xây dựng nên Google Zeitgeist (tạm dịch: Hệ tư tưởng thời đại của Google), một bản tổng kết hàng năm, được phát hành vào cuối mỗi năm, về những chủ đề tìm kiếm phổ biến nhất.)
https://thuviensach.vn
Nhưng thông tin mà người sử dụng cung cấp cho Google đi xa hơn chủ đề trong các truy vấn của họ. Google có khả năng nắm bắt mọi thứ người dùng làm trên trang đó trong log của mình, một thử nghiệm số về các hoạt động mà sự tồn tại của chúng có thể cung cấp chìa khóa đến các đổi mới trong tương lai. Từng khía cạnh trong thói quen của người sử dụng có một giá trị. Có bao nhiêu truy vấn, chúng dài bao nhiêu, những từ dùng nhiều nhất trong các truy vấn là từ nào, người dùng đánh dấu câu thế nào, họ có thường xuyên bấm vào kết quả tìm kiếm đầu tiên không, ai đã chỉ dẫn họ đến với Google, theo địa lý thì họ ở đâu. “Chỉ là các kiến thức cơ bản”, anh nhớ lại.
Những cái log đó biết kể chuyện. Không chỉ thời điểm hoặc cách thức người dùng sử dụng Google mà còn cả đối tượng sử dụng và cách họ suy nghĩ. Patel bắt đầu nhận ra rằng các log này có thể khiến Google thông minh hơn, và anh chia sẻ thông tin log với các kỹ sư tìm kiếm như Jeff Dean và Krishna Bharat, những người quan tâm sâu sắc đến việc cải thiện chất lượng tìm kiếm.
Đến thời điểm đó, Google chưa có cách thức cụ thể về việc lưu trữ các thông tin có thể cho công ty biết người sử dụng của mình là ai và họ đang làm gì. “Trong những ngày đó, dữ liệu được chứa trên các ổ cứng, mà chúng lại thường xuyên bị hỏng, và những cái máy đó thường được chuyển đổi để dùng cho việc khác”, Patel nói. Một ngày nọ, trong sự kinh hoàng của Patel, một trong số các kỹ sư đã chỉ vào ba cái máy và thông báo rằng anh ta cần chúng cho dự án của mình và chuẩn bị format lại các ổ đĩa đó, thứ mà lúc đó chứa hàng nghìn log truy vấn. Patel bắt đầu làm việc với các hệ thống sẽ dùng để chuyển những dữ liệu này đến một nơi an toàn. Cuối cùng, khi bắt đầu có sự phân bổ lực lượng lao động, công ty yêu cầu có ít nhất một người làm việc trên máy chủ mạng, một người phụ trách chỉ mục và một người phụ trách các log.
Vài năm trước, một nhà nghiên cứu về trí tuệ nhân tạo tên là Douglas Lenat đã bắt đầu Cyc(13), một nỗ lực cực kỳ tham vọng nhằm dạy cho các máy tính tất cả kiến thức thông thường mà mỗi người đều hiểu. Lenat thuê
https://thuviensach.vn
các sinh viên để đánh máy một cách cẩn thận tất cả mọi thông tin trong dòng chảy bất tận của những chuyện đời thường thậm chí là hiển nhiên nhất: Một ngôi nhà là một cấu trúc gồm một mái và các bức tường… mọi người sống trong các ngôi nhà… các ngôi nhà có cửa trước… các ngôi nhà có cửa sau… các ngôi nhà có nhiều phòng ngủ và khu bếp… nếu bạn đốt lửa trong một ngôi nhà, nó có thể bị cháy – hàng triệu mẩu thông tin mà một máy tính có thể lấy ra và sử dụng để khi đến thời điểm phân tích một thông tin đề cập đến một ngôi nhà, máy tính đó có thể đưa ra các kết luận thích hợp. Dự án này đã không bao giờ sản xuất ra một máy tính có thể xử lý thông tin tốt như một đứa trẻ bốn tuổi.
Nhưng thông tin mà Google bắt đầu thu thập còn đồ sộ hơn nhiều, và công ty nhận được nó một cách miễn phí. Google nhận ra rằng phản hồi tức thời giống như là cơ sở của một cơ chế học hỏi của trí tuệ nhân tạo. “Douglas làm đề tài của mình bằng cách thuê những người này và đào tạo họ để viết ra các sự việc theo một cách nhất định,” Peter Norvig, người gia nhập Google từ năm 2001 nói. “Chúng tôi thực hiện việc này bằng cách nói rằng: ‘Hãy lấy các thứ mà mọi người đang làm một cách thật tự nhiên.’”
Ở mức độ cơ bản nhất, Google có thể biết được người sử dụng hài lòng như thế nào. Diễn giải lại theo Tolstoy, những người sử dụng đều vui vẻ như nhau. Dấu hiệu rõ nhất về niềm vui của họ chính là “lần bấm dài” (long click) – điều này xảy ra khi ai đó tìm kiếm một kết quả, lý tưởng nhất là kết quả đầu tiên, và không quay lại. Điều đó nghĩa là Google đã hoàn thành truy vấn một cách thành công. Nhưng những người sử dụng không vui vẻ lại không vui theo cách của riêng mình. Đáng kể nhất là các “lần bấm ngắn” khi một người sử dụng mò theo một kết nối và ngay lập tức quay trở về để thử lại. “Nếu họ gõ cái gì đó và sau đó tiếp tục rồi thay đổi truy vấn của họ, bạn có thể nói rằng họ không vui”, Patel nói. “Nếu họ đi tới trang kết quả tiếp theo, nó là dấu hiệu cho biết họ không vui. Bạn có thể sử dụng các dấu hiệu, từ những người không hài lòng với những gì chúng ta đưa cho họ, để quay lại và nghiên cứu những trường hợp đó rồi tìm kiếm các yếu tố nhằm cải thiện việc tìm kiếm.”
https://thuviensach.vn
Công cụ tìm kiếm của Google từ từ xây dựng đủ tri thức để các kỹ sư có thể tự tin cho phép nó chọn khi nào đổi từ này thành một từ khác. Sự cải tiến trước đó về cơ sở hạ tầng của Google, bao gồm cả các công nghệ mà Jeff Dean và Sanjay Ghemawat phát triển nhằm nén dữ liệu để Google có thể đưa chỉ mục vào bộ nhớ máy tính thay vì các ổ đĩa cứng, đã giúp điều này trở nên khả thi. Đó chính là một dự án công trình kỹ thuật dùng để tăng tốc các truy vấn tìm kiếm, cho phép một sự đổi mới hoàn toàn khác biệt. “Một trong số các ưu điểm lớn về chỉ mục trong bộ nhớ đó là nó tăng tính khả thi của việc nhìn vào một truy vấn có ba từ và nói: ‘Tôi muốn xem dữ liệu của 15 từ đồng nghĩa, vì chúng đều liên quan đến nhau’”, Dean nói. “Bạn không bao giờ đủ khả năng làm điều đó trên một hệ thống dựa vào ổ cứng, vì bạn sẽ phải thực hiện 15 cuộc tìm kiếm trên ổ đĩa, và nó sẽ khiến chi phí phục vụ của bạn bị phồng lên rất nhiều. Một chỉ mục trong bộ nhớ hướng đến sự khám phá tích cực hơn của các từ đồng nghĩa và các thứ đại loại như vậy.”
“Chúng tôi đã có một khám phá cực kỳ hữu hiệu,” kỹ sư nghiên cứu Amit Singhal, người đã làm việc rất chăm chỉ về các từ đồng nghĩa, cho biết. “Mọi người thường thay đổi các từ trong truy vấn của mình. Do vậy ai đó sẽ tìm: ‘Hình ảnh của chó’, sau đó họ lại tìm: ‘Hình ảnh của cún con’. Điều này cho thấy chó và cún con có thể thay cho nhau. Chúng ta biết rằng khi bạn đun nước, nó là nước nóng. Chúng tôi đang học ngữ nghĩa từ con người, và đó là một tiến bộ lớn.”
Theo cách tương tự, bằng việc phân tích cách thức mà mọi người xem lại các bước sau một lỗi chính tả, Google phát minh ra ứng dụng kiểm tra chính tả của riêng mình. Ứng dụng này được cài đặt bên trong hệ thống; nếu bạn gõ một từ không chính xác, kiểu gì Google cũng sẽ đưa cho bạn những kết quả đúng.
Nhưng cũng có trở ngại. Hệ thống từ đồng nghĩa của Google bắt đầu hiểu rằng một con chó tương đương với một cún con và nước sôi nghĩa là nóng. Nhưng các kỹ sư cũng phát hiện ra rằng công cụ tìm kiếm cho rằng một cái “hot dog” (bánh mỳ kẹp xúc xích) giống như một chú cún con đang
https://thuviensach.vn
sôi. Vấn đề đã được khắc phục, Singhal nói, bằng một đột phá sau đó vào năm 2002, sử dụng học thuyết của Ludwig Wittgenstein về cách thức các từ được định nghĩa bởi bối cảnh. Khi Google thu thập và lưu trữ hàng tỷ tài liệu và trang mạng, nó phân tích các từ nào thường đứng gần nhau. “Hot dog” sẽ được tìm thấy trong các tìm kiếm có chứa “bánh mỳ”, “mù tạt” và “các trận đấu bóng rổ” – chứ không phải “những chú cún con với bộ lông rất nóng”. Cuối cùng, cơ sở kiến thức của Google hiểu phải làm gì với một truy vấn liên quan đến hot dog – và hàng triệu các từ khác. “Ngày nay, nếu bạn gõ ‘Gandhi bio’, chúng tôi hiểu rằng ‘bio’ nghĩa là ‘biography’ (tiểu sử, lý lịch)”, Singhal nói. “Và nếu bạn gõ ‘bio warfare’, nó có nghĩa là ‘biological’ (sinh học)”.
Sau nhiều năm, Google sẽ khiến dữ liệu trong các log trở thành chìa khóa để phát triển công cụ tìm kiếm của mình. Công ty sử dụng chỗ dữ liệu đó gần như trên từng sản phẩm khác mà công ty sẽ phát triển. Nó sẽ không chỉ ghi lại thói quen của người sử dụng trong các sản phẩm đã được phát hành mà còn tính toán thói quen đó trong vô số các thí nghiệm để thử nghiệm các ý tưởng và cải tiến mới. Hệ thống của Google học được càng nhiều, càng nhiều dấu hiệu mới sẽ được đưa vào trong công cụ tìm kiếm để xác định sự liên quan tốt hơn.
Sergey Brin từng viết phần gốc của công cụ tìm kiếm Google, có nhiệm vụ xử lý sự liên quan. Thời điểm đó còn dựa phần lớn vào PageRank, nhưng ngay từ đầu năm 2000, Amit Singhal nhận ra rằng theo thời gian, ngày càng nhiều các tín hiệu diễn giải được bổ sung, khiến PageRank giảm bớt vai trò trong việc quyết định kết quả. (Thực tế là từ năm 2009, Google cho biết đang sử dụng hơn 200 tín hiệu – mặc dù con số thực gần như chắc chắn là cao hơn rất nhiều – bao gồm cả các từ đồng nghĩa, tín hiệu địa lý, tín hiệu làm mới, và thậm chí là một tín hiệu cho các website bán pizza). Mã (code) rất cần được viết lại; Singhal thậm chí không thể tiếp tục đọc chỗ code mà Brin đã viết. “Tôi viết cái mới ngay lập tức,” anh nói.
Singhal hoàn thành một phiên bản của mã code mới trong hai tháng, và vào tháng 1 năm 2001 nó được đưa vào thử nghiệm. Nhiều tháng sau đó,
https://thuviensach.vn
Google đưa nó ra cho một nhóm người sử dụng và khá hài lòng với kết quả. Họ vui vẻ hơn. Trước hè năm đó, Google đã bật công tắc và trở thành một dịch vụ khác, chính xác hơn. Với thành quả lao động này, Singhal đã được trao danh hiệu Google Fellow (Đồng chí Google) và nhận phần thưởng có giá trị lên tới hàng triệu đôla.
Các công cụ tìm kiếm của Google từ đó sẽ trải qua các biến đổi lớn sau mỗi hai hoặc ba năm. Giữa mỗi lần viết lại trọng đại, các đội đảm bảo chất lượng tìm kiếm của Google liên tục đưa ra các cải tiến tăng trưởng. “Chúng tôi luôn để mắt đến các truy vấn, thường tìm ra lỗi và nói: ‘Tại sao, tại sao, tại sao?’”, Singhal nói. Bản thân anh từng tham gia trong một cuộc tìm kiếm không ngừng để xác định các kết quả nghèo nàn mà từ đó có thể chỉ ra các vấn đề lớn hơn trong thuật toán. Anh bắt đầu có thói quen kiểm tra các log được Google lưu trữ về thói quen của người sử dụng và lấy ra một số truy vấn ngẫu nhiên. Anh biên soạn một danh sách hàng chục nghìn truy vấn, chạy chúng đồng thời trên phiên bản tìm kiếm hiện tại của Google và phần sửa đổi được đề xuất. Lợi ích thứ hai của một thử nghiệm như vậy chính là nó thường nhận diện mô hình lỗi trong một số truy vấn nhất định.
Theo như những gì anh có thể nhớ được, đó là cách mà một truy vấn gây tranh cãi – Audrey Fino – bước vào cuộc sống của Amit Singhal. Nó có vẻ như khá đơn giản: Ai đó gõ “Audrey Fino” lên thanh tìm kiếm của Google và không vui với kết quả. Thật dễ để Singhal thấy được tại sao. Các kết quả cho truy vấn đó bị chi phối bởi các trang tiếng Ý đang tuôn ra hàng tràng về vẻ hấp dẫn của một nữ diễn viên gốc Bỉ – Audrey Hepburn. Đây có vẻ không phải là cái mà người dùng này đang tìm. “Chúng tôi nhận ra rằng đây là tên của một người,” Singhal nói. “Có một người ở đâu đó tên là Audrey Fino và hệ thống không đủ thông minh để biết được điều này.” Cái nữa là, anh nhận ra rằng đó là dấu hiệu của một lỗi lớn hơn cần có thuật toán để xử lý. Tóm lại, công cụ tìm kiếm này gặp khó khăn với những cái tên.
Điều này thúc đẩy một nỗ lực trong nhiều năm để Singhal và nhóm của anh làm ra một hệ thống nhận diện tên trong công cụ tìm kiếm. Những cái
https://thuviensach.vn
tên đều quan trọng. Chỉ có 8% các truy vấn của Google là về tên – và một nửa trong số đó là những người nổi tiếng – nhưng những truy vấn với cái tên mơ hồ hơn lại là các trường hợp mà người dùng có nhu cầu cụ thể (bao gồm cả “tìm kiếm hư danh” khi mà người dùng Google chính mình, một thực tế chung hài hước). Singhal và các đồng nghiệp bắt đầu theo cách hay làm: Với dữ liệu. Để cải thiện tìm kiếm, Google thường tích hợp các cơ sở dữ liệu ngoài, và lần này Google mua bản quyền của White Pages, cho phép sử dụng tất cả thông tin, bao gồm tên, địa chỉ và điện thoại được chứa trong hàng trăm tập giấy in dầy. Công cụ tìm kiếm của Google hút lấy những cái tên và phân tích chúng đến khi nó có thể hiểu một cái tên là gì và làm thế nào để nhận biết nó trong hệ thống.
Trong vài tháng, đội của Singhal đã xây dựng hệ thống để sử dụng thông tin đó và phân tích cú pháp của các truy vấn tên một cách thích đáng. Một thời gian sau, Singhal một lần nữa gõ lại truy vấn rắc rối đó. Lần này, hiện lên trên đầu là hàng tràng các trang về một cô gái hấp dẫn và tinh quái từng đóng trong phim Roman Holiday, có một kết nối cung cấp thông tin về một luật sư, người từng – ít nhất là trong một khoảng thời gian – sống tại Malta: cô Audrey Fino.
“Như vậy hiện giờ chúng tôi có thể nhận biết tên và xử lý đúng cách khi có vấn đề xuất hiện,” Singhal nói, 5 năm sau cuộc truy lùng đó. “Và hệ thống nhận diện tên của chúng tôi hiện giờ còn tốt hơn nhiều so với khi tôi làm ra nó, và tốt hơn bất kỳ thứ gì khác ngoài kia, cho dù người khác có nói gì đi nữa.”
Một lần, vào năm 2009, anh trình diễn cho một người khách xem hệ thống của mình hoạt động tốt như thế nào, ngoài ra cũng hé lộ một số bí mật khác của công cụ tìm kiếm này. Anh mở máy laptop của mình và gõ vào đó truy vấn: “mike siwek lawyer mi”.
Anh gõ mạnh vào phím ENTER. Trong một khoảng thời gian được tính toán chính xác nhất theo nhịp đập cánh của chim ruồi, mười kết quả xuất hiện. Trong trường hợp này, kết quả đầu tiên là một kết nối đến trang chủ của một luật sư có tên Michael Siwek tại Grand Rapids, Michigan. Thành
https://thuviensach.vn
công này đến như là kết quả của nhiều nỗ lực nhằm giải quyết vấn đề Audrey Fino. Chìa khóa dẫn đến việc hiểu một truy vấn như thế này, Singhal nói, là sự mầu nhiệm huyền bí của “cách thức”: Đó là một công cụ tìm kiếm phân tích một loạt các từ được nhập vào trường truy vấn và phân loại chúng theo cách mà một con người thông minh sẽ làm.
“Hãy phân tích truy vấn [Siwek] này từ quan điểm của một kỹ sư”, Singhal nói. “Phần lớn các công cụ tìm kiếm tôi từng biết sẽ bắt đầu ‘một từ, hai từ, ba từ, bốn từ, xong’. Tại Google, chúng tôi nói: ‘A ha! Chúng ta có thể bẻ nó ở đây!’ Chúng tôi mường tượng rằng ‘luật sư’ (lawyer) không phải là họ và ‘Siwek’ không phải là tên đệm,” anh nói. “Và tiện đây, luật sư không phải là một thị trấn tại Michigan. Luật sư là người được ủy quyền.”
Tất cả điều này giúp giải thích làm thế nào Google có thể tìm được ai đó, mà tên người này có thể chưa bao giờ xuất hiện trong một tìm kiếm nào trước đây. (Một phần ba tất cả các truy vấn đều là những yêu cầu chưa từng được khai phá). “Mike Siwek là một ai đó gần như chưa từng được tiếp cận trên Internet,” Singhal nói. “Tìm kim đáy bể, nó diễn ra như vậy đấy”.
Lịch sử bí mật của Google được nhấn mạnh bởi những tiến bộ tương tự, một di sản chấn động trong khoa học máy tính và sự kín miệng của công ty. Những người hùng tìm kiếm của Google là những người hùng tại Google nhưng vô danh ở nơi khác. Công cụ tìm kiếm của Google luôn có những tiến bộ rõ rệt trong việc thu thập thông tin, lập chỉ mục, đưa ra những kết quả nhanh và chính xác. Những kết quả mà Google đạt được dựa trên việc thu thập nhiều thông tin nhất có thể.
Google gọi cái này là “tính chất toàn diện” và đã có một đội khoảng 300 kỹ sư đảm bảo việc các chỉ mục nắm bắt được mọi thứ. Một phó Giám đốc phụ trách kỹ thuật của Google nói: “Chúng tôi muốn có một bản sao giống bản gốc nhất có thể, cả về thời gian và hình ảnh, và sau đó chúng tôi muốn tổ chức theo cách thức phục vụ dễ dàng và hiệu quả, và cuối cùng là xếp hạng.”
Google làm tất cả những gì có thể để truy cập các trang đó. Nếu trang mạng yêu cầu người dùng điền vào mẫu đăng ký để xem một nội dung nhất
https://thuviensach.vn
định, Google có thể đã dạy các con nhện của mình cách điền vào mẫu đó. Đôi khi nội dung bị khóa bên trong các chương trình chạy khi người dùng ghé thăm một trang – các ứng dụng chạy trên ngôn ngữ JavaScript hoặc chương trình media như Adobe’s Flash. Google biết cách để nhìn vào bên trong các chương trình đó và lôi nội dung trong đó ra cho chỉ mục của mình. Google thậm chí sử dụng nhận dạng ký tự quang học để tìm xem liệu một tấm ảnh trên website có chữ trên đó hay không.
Sự tích lũy của tất cả những cải tiến đó kéo dài vị trí dẫn đầu của Google so với các đối thủ, và số lượng người sử dụng dịch vụ của Google đã tăng với tốc độ chóng mặt, giúp Google nhanh chóng chiếm lĩnh thị trường. Thậm chí những đối thủ khó nhằn nhất của Google cũng phải thừa nhận rằng Brin và Page đã xây dựng nên điều gì đó thật đặc biệt. “Trong ngành thương mại về công cụ tìm kiếm, Google thổi bay những người sáng tạo đầu tiên, đơn giản là thổi họ bay mất,” Bill Gates nói. “Và những thứ còn lại của những người đó sẽ sớm bị chìm vào quên lãng”.
Một trong số những vinh quang của PageRank (ngay từ đầu đã vượt trội hơn cả AltaVista) là khả năng chống spam. (Thuật ngữ này chỉ những thư điện tử không được chào đón, nhưng những đường dẫn đến trang có chứa thứ này vẫn đứng ở vị trí cao trên trang kết quả vì đánh lừa được hệ thống.)
Người chịu trách nhiệm tạo ra sản phẩm tìm kiếm an toàn (Safe Search), thứ sẽ cho phép mọi người chặn bỏ các trang khiêu dâm khỏi các kết quả tìm kiếm, có tên là Matt Cutts. Thoát khỏi nội dung khiêu dâm không mong muốn luôn là một ưu tiên đối với Google. Nỗ lực đầu tiên của công ty là xây dựng một danh sách gồm khoảng 500 từ “dơ bẩn”. Nhưng năm 2000, Google nhận được một hợp đồng cung cấp dịch vụ tìm kiếm cho một nhà cung cấp muốn mang phiên bản tìm kiếm an toàn cho gia đình (family safe) cho các khách hàng của mình. Brin và Page hỏi Cutts về suy nghĩ của anh ta đối với khiêu dâm. Anh sẽ phải nghiên cứu chúng rất nhiều để làm ra một hệ thống lọc nó ra khỏi Google.
Các trang khiêu dâm lớn hoàn toàn ủng hộ tiến trình này; họ biết rằng sẽ chẳng tốt đẹp gì cho họ nếu những người không quan tâm đến nội dung
https://thuviensach.vn
khiêu dâm vô tình gặp phải cái nhà kho tội lỗi của họ, khiến họ trở thành đối tượng của những kẻ bới lông tìm vết và các nhà lập pháp. Nhưng không phải tất cả những trang này đều là công dân tốt. Cutts để ý rằng một trang dơ bẩn nọ đã sử dụng một số biện pháp thông minh để “chơi” hệ thống chặn của Google và ghi điểm cao trong các kết quả tìm kiếm. “Đó là khoảnh khắc cực kỳ bất ngờ”, Cutts nói. “PageRank và phân tích kết nối có thể chống spam, nhưng không có thứ gì là spam không thể đâm thủng”.
Vấn đề đi xa hơn cả khiêu dâm. Google đã chiếm được lòng khán giả một phần vì nó hữu hiệu trong việc tiêu diệt spam tìm kiếm. Nhưng vì Google đang là phương tiện chi phối về tìm kiếm mọi thứ trên Internet, một từ khóa đưa ra có xếp hạng cao có thể đưa đến doanh thu hàng triệu đôla cho một trang. Các trang hiện giờ đang dành thời gian, năng lượng và những phù thủy công nghệ để dịch các tiến trình của Google và tăng hạng pagerank một cách nhân tạo. Thủ đoạn này được gọi là tối ưu hóa công cụ tìm kiếm hay SEO. Bạn có thể thấy rất rõ vấn đề này khi gõ tên của một khách sạn. Trang web thực tế của khách sạn đó không hiển thị trong những kết quả đầu tiên. Thay vào đó, các kết quả hàng đầu bị chiếm lĩnh bởi các công ty chuyên về đặt phòng khách sạn. Việc này khiến Google trở nên ít hữu dụng hơn. Cutts tìm đến Wayne Rosing và nói với anh ta rằng công ty này thực sự cần nghiên cứu việc chặn spam. Rosing bảo anh cứ thử làm đi.
Cần phải có sự cân bằng. Các doanh nghiệp hợp pháp, và cả các công ty hoạt động mờ ám, đều tham gia trò vui. Những chuyên gia tư vấn được trả hậu hĩnh để tìm cách dịch ngược PageRank và các công nghệ khác của Google. Cả những cá nhân nghiệp dư cũng đã tham gia vào cuộc chơi, tìm mua những cuốn sách như Tối ưu hóa Công cụ Tìm kiếm cho mọi người. Các chuyên gia cũng thường xuyên gặp gỡ và thảo luận về những vấn đề này.
Google thừa nhận rằng một số phương pháp SEO cụ thể (Search Engine Optimization For Dummies) – chẳng hạn như đưa vấn đề nội dung của trang lên tiêu đề hay thuyết phục quản trị web của các website phổ biến đặt đường kết nối dẫn đến site của bạn – có tác dụng cho mạng nói chung.
https://thuviensach.vn
Nhưng điều này cũng đặt ra một câu hỏi: Nếu một website phải cần đến các yếu tố bên ngoài mới có thể tăng thứ hạng, vậy thì chẳng phải đây là một thất bại của Google hay sao, khi mà nhiệm vụ của Google là trả về cho người dùng các kết quả tốt nhất, không cần biết thông tin được định dạng thế nào hay nó được dẫn kết nối từ đâu đến?
“Mô hình lý tưởng là không ai phải học SEO,” Cutts nói. “Nhưng sự thực là nó có tồn tại và mọi người đang phải cố gắng để tự nâng tầm của mình.” Cutts đã thừa nhận rằng bởi vì không phải ai cũng có chuyên môn về SEO, nên đôi khi Google đã đánh giá thấp những trang web đáng giá. Có một ví dụ khá nổi tiếng: Truy vấn “Eika Kerzen”. Đây không phải là tên người mà thực tế là tên của một hãng sản xuất nến của Đức (kerzen trong tiếng Đức có nghĩa là “nến”). Thật đáng xấu hổ vì thông tin về nhà sản xuất này lại có thứ hạng rất thấp trong khi những từ khóa đó đáng lẽ đã phải giúp tìm ra những sản phẩm tuyệt vời của Eika Kerzen. Vấn đề này bị đổ lên đầu Amit Singhal, người đã sửa đổi thuật toán để Google dịch một phần của truy vấn sang một ngôn ngữ khác, giải pháp cho toàn bộ những kết quả tìm kiếm phiền toái dạng này.
Một cuộc chạy đua âm ỉ đã nổ ra giữa các thuật toán tìm kiếm của Google và các công ty đang cố gắng lợi dụng hệ thống để trục lợi. Trong nhiều năm, những thay đổi trong cơ chế chặn spam được đều đặn triển khai trong các cập nhật chỉ mục hàng tháng của Google. Google tiến hành cập nhật này theo chu trình của mặt trăng. “Bất cứ khi nào mặt trăng tròn sắp xuất hiện, mọi người lại bắt đầu mong ngóng các thay đổi của Google,” Cutts cho biết. Cộng đồng SEO sẽ căng thẳng chờ đợi những thay đổi có thể sẽ loại đường dẫn của mình ra khỏi vị trí thích hợp. Khi những giá trị mới vừa được thể hiện ở kết quả tìm kiếm, cộng đồng SEO sẽ cố gắng để tìm ra lôgic ẩn phía sau thuật toán mới và tính kế để những đường dẫn bị “hạ bệ” có thể tìm lại được vị trí ban đầu của chúng. Chuỗi những sự việc này được đặt tên là “điệu nhảy Google”. (Mọi việc càng trở nên rối rắm hơn sau khi dự án BART thay đổi hình thức cập nhật chỉ mục, các chỉ mục liên tục được cập nhật thay vì từng đợt như trước kia.)
https://thuviensach.vn
Thông thường, sự thay đổi về thứ hạng là không đáng kể và bao giờ cũng có cách để khôi phục một kết nối về vị trí hào quang trước đó. Nhưng cũng có những lần Google xác định được hành vi mà theo đánh giá là đang cố gắng khai thác các lỗ hổng trong hệ thống xếp hạng, khi đó Google sẽ điều chỉnh hệ thống để che lấp những khuyết điểm này – đồng nghĩa với việc đẩy những kết nối sử dụng phương pháp đó xuống dưới cùng. Về cơ bản, những kết nối này sẽ không còn cơ hội để xuất hiện ở các vị trí phía trên đối với những từ khóa tìm kiếm phổ biến: Chúng sẽ lén lút tăng thứ hạng cho mình bằng cách tạo nên một đội quân các kết nối. Dù thế nào, những công ty bị đối xử bằng cách này thường cảm thấy bị xúc phạm.
Cutts hiểu rằng sự mập mờ, không rõ ràng có thể ảnh hưởng xấu tới công ty và tự nhận trách nhiệm bảo vệ công ty trước cộng đồng SEO. Với biệt hiệu “Gã Google”, Cutts trả lời các câu hỏi và cố gắng đánh bại những âm mưu, rất nhiều trong số đó tập trung xung quanh nghi ngờ rằng cách chắc chắn nhất để tăng thứ hạng tìm kiếm là mua các quảng cáo của Google. Nhưng Cutts không thể nói quá nhiều. Phần lớn là vì mối đe dọa đến từ các spammer – cũng như từ nỗi lo sợ rằng những thông tin về hệ thống có thể làm lợi cho các đối thủ – Google luôn giữ bí mật tuyệt đối cho các thuật toán của mình. Sau vài năm, đội chuyên về spam của Cutts đã lớn mạnh đáng kể (cũng giống như Google, Cutts sẽ không nêu con số cụ thể). “Tôi có thể tự hào nói rằng tỉ lệ spam qua website đã giảm đi rất nhiều so với vài năm trước đây”, anh chia sẻ.
Nhưng Google cũng phải trả giá. Khi công ty chiếm được vị thế thượng phong trên thị trường tìm kiếm – hơn 70% thị phần tại Mỹ, con số này thậm chí còn cao hơn ở một số quốc gia – các nhà phê bình càng lúc càng thấy khó chịu khi cứ phải tin những lời của Google rằng hãng này đang không sử dụng các thuật toán của mình để kinh doanh và cạnh tranh. Để bảo vệ chính mình, Google đã biện hộ rằng: Cố tình thay đổi kết quả tìm kiếm tốt nhất sẽ làm cho sản phẩm của Google không còn hiệu quả, do đó có thể khiến người dùng mất niềm tin. Nhưng Google cũng từ chối công bố dữ liệu chứng minh rằng hãng làm việc một cách ngay thẳng, có nghĩa là
https://thuviensach.vn
Google chấp nhận rủi ro khi cố gắng giữ niềm tin của người dùng. Nếu bạn không tin tưởng Google, làm thế nào bạn có thể tin tưởng cái thế giới thể hiện qua những kết quả tìm kiếm của Google?
3.
“Nếu bạn google nó, bạn đã nghiên cứu nó còn nếu không bạn đã chẳng làm thế.” Để hiểu hơn những bước tiến của công cụ tìm kiếm Google trong sáu hoặc bảy năm đầu tiên của công ty, ta có thể nhìn qua lăng kính của Udi Manber.
Manber chuyên nghiên cứu về tìm kiếm thông tin và từng có kinh nghiệm làm việc trong lĩnh vực này tại Yahoo đồng thời làm trưởng nhóm A9, một nhóm tìm kiếm được thành lập bởi Jeff Bezos. Tháng 2 năm 2006, Manber chính thức làm việc tại Google với tư cách là trưởng bộ phận tìm kiếm. “Bỗng nhiên tôi được chịu trách nhiệm trước tất cả những ai có câu hỏi trên khắp thế giới,” anh chia sẻ. “Tôi nghĩ mình đã có ý tưởng phù hợp cho các vấn đề, dù lớn hay nhỏ, mà việc tìm kiếm đang gặp phải. Khi đến đó, trái với hình dung của mình, tôi thấy họ đã giải quyết được rất nhiều những khó khăn nho nhỏ và đang nhắm tới những vấn đề lớn hơn. Google không chỉ nói: ‘Đây là những gì tiên tiến nhất, là những gì sách giáo khoa dạy chúng ta, hãy cùng thực hiện’, mà họ phát triển mọi thứ ngay từ đầu và làm cho chúng tốt hơn.”
Manber cũng đã sửng sốt đối với cách mà các nhân viên ở đây được nuông chiều. Mỗi một kỹ sư tìm kiếm được quyền sử dụng riêng một nhóm các server lưu trữ chỉ mục của toàn bộ mạng – nó giống như việc cấp riêng cho nhà vật lý học một chiếc máy gia tốc hạt.
Một trong những thứ đầu tiên đập vào mắt Manber có tên là Universal Search (Tìm kiếm Vạn năng). Trong những năm đầu tiên của mình, Google
https://thuviensach.vn
đã phát triển một số dạng tìm kiếm chuyên dụng, được gọi là các đầu cực, cho nhiều bộ sưu tập khác nhau như phim, hình ảnh, các danh mục mua sắm và địa điểm (bản đồ). Krishna Bharat đã sáng tạo ra một trong các đầu cực này, đó là Google News, một hệ thống ảo chuyên cung cấp thông tin, nơi mà trang nhất được thuật toán lựa chọn chứ không phải các biên tập viên. Một sản phẩm khác, được gọi là Google Scholar, chuyên dùng để đánh giá các tạp chí học thuật. Nhưng để truy cập được các hình thức tìm kiếm theo cực này, người dùng cần phải lựa chọn một cực trong đó. Page và Brin đã bắt đầu thúc đẩy việc tạo ra một hệ thống có thể tìm được mọi thứ chỉ với một lần tìm kiếm.
Người kỹ sư có vai trò chủ chốt trong dự án này là David Bailey, trước đó đã cùng làm việc với Manber tại A9. Tốt nghiệp tiến sĩ về khoa học máy tính tại Đại học Berkeley, Bailey từng lo lắng rằng việc theo đuổi đam mê của mình – trí tuệ nhân tạo và cách thức mà máy tính xử lý ngôn ngữ tự nhiên – chính là đang tự nhốt mình vào một lĩnh vực có rất ít ứng dụng thực tế. “Tôi đã nghĩ rằng chẳng ai lại đi thuê một người tốt nghiệp tiến sĩ làm những việc này cả, bởi vì mọi người đều biết rằng không một ứng dụng máy tính nào đủ thành thạo để có thể xử lý một đoạn văn bản tiếng Anh”. Nhưng đó là trước khi anh gia nhập Google vào năm 2004.
Tại Google, anh được thoải mái nghĩ xem mình thực sự muốn làm gì. Anh còn phát hiện ra mình được làm việc cùng Amit Singhal, Matt Cutts và Ben Gomes (vốn là những bạn học cũ ở bậc sau đại học) – “chắc chắn đây là văn phòng của những đứa trẻ tuyệt vời”, anh nói – và bị ngây ngất bởi những cuộc đối thoại phong phú. Bailey đã phải vận dụng toàn bộ kiến thức chuyên môn mà mình có khi được giao nhiệm vụ tăng cường hiệu quả của công cụ tìm kiếm Google, để trang hiển thị kết quả không chỉ là về mạng, mà cả các kết quả về tranh ảnh, sách, video và các nguồn khác. Nếu Google thực sự quan tâm đến việc “tổ chức và tạo khả năng tiếp cận nguồn thông tin của thế giới,” như công ty vẫn thường xuyên khoe khoang (có vẻ như có cả sự ngạo mạn), công ty thực sự cần mở rộng các kết quả tìm kiếm đầu tiên của mình ra khỏi phạm vi của những trang mạng. Tuy nhiên, có quá
https://thuviensach.vn
nhiều trở ngại và nhiều cố gắng trước đó nhằm thực hiện viễn cảnh này đều thất bại. “Nó đã trở thành một dự án chết,” Bailey nhớ lại. Dù thế, Bailey vẫn chấp nhận nhiệm vụ. Anh đã lập nên một đội, trong đó có Johanna Wright, một Giám đốc phụ trách sản phẩm thông minh. Mặc dù Larry Page đã thúc giục việc phát triển Universal Search trong nhiều năm, vẫn còn có rất nhiều ý kiến phản đối. “Rõ ràng là có một giai đoạn chạy đà,” Wright phát biểu, “và cuối cùng cũng đến lúc tất cả mọi người đều muốn tham gia vào dự án, và toàn bộ công ty đều đồng lòng.” Một thử thách lớn trong việc phát triển Universal Search là làm thế nào để xác định được giá trị của thông tin khi chúng đến từ nhiều nơi khác nhau. Trước đó, Google đã làm khá tốt trong việc tìm ra cách thức để xếp hạng các website cho một truy vấn và công ty cũng đã học được nhiều khi yêu cầu các kho ảnh, video thỏa mãn các yêu cầu tìm kiếm. Mỗi kho đều có những dấu hiệu riêng. (Tất nhiên, mọi thứ trên mạng đều hưởng lợi từ thông tin kết nối, nhưng những thứ như video không có điều tương tự.) Dù vậy, với Universal Search, Google đã phải tính toán sức nặng tương đối để gán với những tổ hợp tín hiệu khác nhau. Nó giống như vấn đề so sánh giữa táo và cam. Câu trả lời, cũng giống như nhiều thứ khác ở Google, nằm ở việc xác định bối cảnh từ dữ liệu trong các log – cụ thể là trong việc phân tích những cú nhấp dài trước đây. “Có rất nhiều dấu hiệu có thể cho chúng ta biết dự định nằm sau các truy vấn,” Wright cho biết. “Có thể có thông tin nằm trong một truy vấn cho chúng ta biết rằng một kết quả về tin tức là thực sự quan trọng và rồi ta sẽ đặt kết quả đó ở đầu trang.” Nhưng rõ ràng giải pháp này bao gồm cả việc giải mã dự định của một truy vấn. Trong một vài trường hợp, hóa ra các tín hiệu của Google tại một vùng cho sẵn lại không đủ hiệu quả. “Đó lại là cơ hội để chúng tôi xem lại thứ tự của chúng,” Bailey nói. “Cuối cùng, đã đến lúc để Google chuyển đổi vấn đề xếp hạng thành việc so sánh táo với táo”.
Vấn đề phức tạp hơn hóa ra lại nằm ở việc làm thế nào để hiển thị các kết quả trên trang. Mặc dù Google có thể tính ra được một số kết quả nhất định – một video clip, một cuốn sách, một hình ảnh hoặc một bài viết uyên
https://thuviensach.vn
thâm – có thể phù hợp với một truy vấn, nhưng thực tế người sử dụng chủ yếu lại hi vọng sẽ nhìn thấy các kết nối mạng thống trị trang kết quả. Khi sản phẩm đầu tiên được nhóm phát triển Universal Search trình lên những người đứng đầu Google, mọi người đều nhận ra rằng việc tham gia một dự án chết đã đem lại kết quả xứng đáng. Dù thứ tự sắp xếp các kết quả chưa chính xác, nhưng cái cốt lõi nằm ở sự phản ứng – bạn gõ một từ và tất cả những thứ này hiện ra. Điều này chưa từng xảy ra trước đó. “Rõ ràng nó đầy rủi ro,” Bailey nói. “Thật khó để thực hiện, bởi vì nó không đơn giản chỉ là khoa học, nó còn cần đến lý trí, sự quyết đoán của con người. Mỗi sáng thức dậy, tôi vẫn chưa quen được với sự thật rằng tất cả những thứ này lại có thể hoạt động được.”
Công cụ tìm kiếm của Google giờ đây không còn đơn giản chỉ là tìm kiếm trên mạng nữa. Nó tìm kiếm mọi thứ.
Trong cuốn sách Thế giới trong gương (Mirror Worlds) xuất bản năm 1991 của mình, David Gelernter, tốt nghiệp khoa học máy tính tại Đại học Yale, đã phác thảo ra một tương lai khi con người có thể tương tác, kinh doanh với những mô hình số đại diện cho thế giới thực. Gelernter miêu tả những hình bóng này như “một hình ảnh trong gương của thế giới thực bị nhốt trong một chiếc máy vi tính.” “Điều quan trọng nhất về thế giới trong gương là nó có không gian và thời gian thực – nó phản ánh thế giới thực chứ không phải là một thực tế song song hay là một thế giới ảo,” Gelernter nói. Tuy nhiên, hào hứng nhìn vào viễn cảnh của thế giới trong gương, ông cũng có những lo lắng. “Cảm xúc của tôi về thế giới trong gương rất mâu thuẫn. Nguy cơ bị theo dõi là rõ ràng, nhưng tôi cho rằng còn có những mối đe dọa sâu xa hơn.” Mối lo lắng lớn nhất của Gelernter là các thế giới này có thể bị điều khiển bởi những công ty lập dị nhạt nhẽo. “Không chỉ những kẻ đam mê công nghệ mà cả xã hội sẽ phải đối mặt với những nguy cơ này. Tôi không tin tưởng họ. Họ không có tâm trí rộng mở và cũng không đủ hiểu biết. Họ không biết nhiều về lịch sử, không có đủ kiến thức về bản chất của xã hội. Tôi nghĩ đây chính là công thức của một thảm họa.”
https://thuviensach.vn
Nhưng dù thích hay không, Google, vốn là công ty đam mê công nghệ bậc nhất, cũng đang xây dựng một thế giới trong gương. Vì nhiều mục đích thực tế khác nhau, những thông tin không được lưu trữ trong các chỉ mục khổng lồ của Google, nơi chứa tất cả những trang web công khai bên cạnh rất nhiều những thứ khác, có thể cũng chẳng hề tồn tại. “Có vẻ như mọi người đều nghĩ rằng: ‘Nếu bạn đã Google nó, tức là bạn đã nghiên cứu nó, còn nếu không bạn đã chẳng làm thế,” Sergey Brin chia sẻ.
Trong khi thực hiện những sửa đổi quan trọng như Universal Search, Google nhìn chung vẫn không ngừng cải tiến công cụ tìm kiếm của mình. Hàng tá kỹ sư miệt mài với những truy vấn lỗi, cố gắng xác định liệu nguyên nhân có xuất phát từ những khiếm khuyết nằm sâu trong các thuật toán, như trong trường hợp của Audrey Fino, hay không.
Xử lý một truy vấn thất bại bằng cách khắc phục lỗi của thuật toán không phải là một hướng đi đúng đắn. Đó là hướng đi không thể mở rộng; nó mâu thuẫn với ý kiến cho rằng thuật toán tìm kiếm khổng lồ của Google có khả năng tìm ra tài liệu thích hợp nhất chỉ với lôgic của mình. Một truyền thuyết được kể tại Google minh chứng cho nguyên tắc này. Đó là vào khoảng năm 2002, một nhóm kỹ sư lúc đó đang thử nghiệm một tìm kiếm trong nhóm nhỏ, giới hạn ở một số sản phẩm, có tên là Froogle. Nhưng có một vấn đề rõ rệt khiến cả đội không hề thấy yên tâm nếu ra mắt Froogle vào thời điểm đó: Nếu gõ cụm từ “giầy chạy” (running shoes), kết quả đầu tiên được tìm thấy lại là bức tượng chú lùn làm vườn tình cờ đang đi một đôi giầy quần vợt. Ngày này sang ngày khác, các kỹ sư của Google gắng sức thay đổi chỗ này chỗ kia của thuật toán để Froogle có thể phân biệt giữa nghệ thuật cắt cỏ với giầy dép, nhưng hình ảnh chú lùn vẫn xuất hiện trên cùng. Một ngày nọ, điều kỳ diệu đã xảy ra khi hình ảnh đó bỗng biến mất khỏi trang kết quả tìm kiếm. Một cuộc họp diễn ra, nhưng không một ai trong đội nhận đó là thành quả công việc của mình. Có một kỹ sư đến khá muộn, mang theo một bức tượng người lùn đi giầy chạy. Anh đã mua sản phẩm độc đáo này trước đó, và vì đợt giảm giá đã kết thúc nên hình ảnh này không còn xuất hiện trong chỉ mục nữa. “Thuật toán giờ đã cho kết quả
https://thuviensach.vn
chính xác,” người kỹ sư nói. “Chúng tôi không gian lận, cũng chẳng thay đổi bất kỳ thứ gì cả, nhưng chúng tôi đã làm được.”
Qua năm tháng, Google đã định hình được quy trình cải tiến công cụ tìm kiếm của mình. Khi xuất hiện một “lỗ hổng”, một chuyên viên phân tích về tìm kiếm sẽ được chỉ định để giải quyết vấn đề. Chuyên viên phân tích này có trách nhiệm xác định vấn đề và tiến hành mã hóa lại phần tương ứng của thuật toán tìm kiếm. Có thể sẽ phải điều chỉnh lại giá trị của tín hiệu. Hoặc cũng có khi là thay đổi cách hiểu của từ “bigrams”. Hoặc thậm chí là tích hợp thêm một tín hiệu mới. Sau đó, tư vấn viên là người sẽ đưa những thay đổi đó vào thử nghiệm.
Hàng trăm người trên khắp thế giới tham gia vào một phần của thử nghiệm này, họ sẽ ngồi trước máy tính cá nhân của mình, dựa vào kết quả của một loạt các truy vấn để đưa ra nhận định liệu những kết quả này có tốt hơn kết quả của những phiên bản cũ không. “Thành viên của chúng tôi có mặt ở hơn 100 địa điểm khác nhau,” Scott Huffman, Giám đốc kỹ thuật, phụ trách quá trình thử nghiệm, cho biết. “Chúng tôi có các thẩm định viên Thụy Sỹ-Pháp, Thụy Sỹ-Đức và rất nhiều địa điểm khác”. Nhưng Google còn sử dụng một đội quân thử nghiệm viên khổng lồ hơn rất nhiều – hàng triệu người sử dụng của mình, hầu hết trong số họ vô tình đã trở thành những chú chuột bạch cho các thử nghiệm về chất lượng đang được Google liên tục tung ra.
Trụ cột chính của hệ thống này là “thử nghiệm A/B”, có nghĩa là một tỉ lệ người sử dụng – thường là 1% – sẽ tiếp xúc với thay đổi được đề xuất. Các kết quả tìm kiếm và hành vi của những người này sẽ được đem ra để so sánh với những người sử dụng còn lại. Google đã đánh giá từng thay đổi của mình theo cách này, từ những thay đổi về màu sắc giao diện cho đến thay đổi về số lượng kết quả hiển thị trên mỗi trang. Đã có nhiều thay đổi đến mức Google phải bỏ qua một phương thức của khoa học truyền thống là chỉ nên tiến hành từng thử nghiệm một và ngoại trừ sự thay đổi đang được thử nghiệm, tất cả mọi thứ còn lại phải giống hệt nhau ở cả hai nhóm, nhóm thử nghiệm và nhóm so sánh. “Có quá nhiều thứ cần được thử
https://thuviensach.vn
nghiệm, nên chúng tôi không thể đặt bạn vào một nhóm duy nhất nào đó được, nếu không sẽ không đủ người,” Giám đốc phụ trách chất lượng tìm kiếm cho biết. “Với hầu hết các truy vấn gửi đến Google, cùng một lúc bạn đang tham gia vào nhiều nhóm thử nghiệm và nhóm so sánh khác nhau. Về cơ bản, tất cả các truy vấn đều có dính líu đến một vài thử nghiệm nào đó.” Tính riêng trong năm 2009, các kỹ sư của Google đã thực hiện hơn 600 thay đổi để cải thiện chất lượng của công cụ tìm kiếm của mình.
Không phải ngẫu nhiên khi người sau này đứng đầu trung tâm nghiên cứu của Google lại chính là đồng tác giả của Trí tuệ nhân tạo: Một hướng tiếp cận hiện đại (Artifi cical Intelligence: A Modern Approach), cuốn giáo trình chuẩn mực về lĩnh vực này. Peter Norvig trước đó phụ trách Trung tâm Khoa học Tính toán của NASA tại Ames, không xa trụ sở của Google. Vào cuối năm 2000, khi các chương trình của anh gặp không ít khó khăn, Peter Norvig nhận ra rằng đây là thời điểm tốt để thay đổi. Buổi thuyết trình của Larry Page mà anh tham dự vài tháng trước khiến anh có cảm giác chính nỗi ám ảnh mang tên dữ liệu của Google có thể là cơ hội dành cho mình. Norvig gửi email tới Page và rất nhanh sau đó đã nhận được hồi âm – cuốn sách về trí tuệ nhân tạo của Norvig trước đó đã được chỉ định là giáo trình đọc cho một trong những khóa học của Page. Sau khi đến Google, Norvig nhanh chóng thuê nửa tá cộng sự cho các dự án của mình. Anh mong muốn tất cả mọi người trong công ty đều được đào tạo về trí tuệ nhân tạo.
Một trong những việc cần làm được Google ưu tiên là dịch thuật, chuyển đổi hàng tỉ từ xuất hiện trên mạng sang ngôn ngữ của bất kỳ người sử dụng nào trên thế giới. Tới năm 2001, Google.com đã có sẵn 26 ngôn ngữ khác nhau. Page và Brin tin rằng không nên để các rào cản nhân tạo như ngôn ngữ cản trở quá trình tiếp cận thông tin của loài người. Suy nghĩ này cũng đồng nhất với quan điểm của người đi tiên phong về dịch tự động, Warren Weaver. Weaver từng nói: “Nhìn vào một bài báo tiếng Nga, tôi nói: ‘Thật ra nó được viết bằng tiếng Anh, nhưng được mã hóa thành những ký tự kỳ
https://thuviensach.vn
lạ. Giờ tôi sẽ giải mã nó.’” Với Google, họ sẽ giải mã tất cả các ngôn ngữ trên hành tinh này.
Người phụ trách việc giải mã các ngôn ngữ này tại Google là Franz Och, một tiến sỹ về khoa học máy tính từng nghiên cứu về dịch tự động. Och gia nhập Google vào tháng 4 năm 2004.
Những cố gắng dịch tự động trước đó thường được bắt đầu với các chuyên gia, những người biết cả hai thứ tiếng có liên quan đến việc chuyển đổi ngôn ngữ. Các chuyên gia này sẽ kết hợp các quy luật với cấu trúc của mỗi ngôn ngữ nhằm tách bạch cấu trúc đầu vào và tìm cách diễn đạt lại bằng ngôn ngữ còn lại. “Việc làm này không chỉ tiêu tốn thời gian mà còn rất khó khăn, bởi vì ngôn ngữ tự nhiên quá phức tạp, phong phú, chưa kể đến có rất nhiều sắc thái đi kèm,” Och cho biết. Nhưng vào cuối những năm 1980, một số nhà khoa học máy tính của IBM đã nghĩ ra một cách tiếp cận mới, được gọi là dịch tự động theo thống kê, và Och đã nhanh chóng nắm lấy cơ hội này. “Điểm mấu chốt ở đây là sự học hỏi từ dữ liệu,” anh giải thích. “Cung cấp cho máy tính một số lượng lớn các nội dung đơn ngữ và nó sẽ tự tìm ra cấu trúc trong các nội dung này.” Ý đồ ở đây là nạp cho máy tính những lượng dữ liệu khổng lồ và để cho anh ấy (theo cách nói nhân cách hóa của Och) tự suy nghĩ. Về cơ bản, hệ thống của Google tạo ra một “hình mẫu ngôn ngữ” cho mỗi thứ tiếng đã được nhóm của Och nghiên cứu. Bước tiếp theo là làm việc với các đoạn văn bản thuộc nhiều ngôn ngữ khác nhau sau khi đã được dịch sang một ngôn ngữ khác và để máy tự tính toán nhằm tìm ra các thuật toán ẩn quy định cách thức dịch một ngôn ngữ này sang một ngôn ngữ khác. “Có những thuật toán riêng biệt dành cho việc học tương quan câu chữ, những thuật toán chuyên tìm hiểu các sắc thái trong mỗi đoạn ngôn từ và thực hiện chuyển đổi ngôn ngữ. Điều mấu chốt ở đây là bạn có càng nhiều dữ liệu, chất lượng của hệ thống sẽ càng được cải thiện,” Och cho biết.
Dữ liệu quan trọng nhất chính là các cặp tài liệu được dịch khéo léo từ ngôn ngữ này sang một ngôn ngữ khác. Trên Internet, nguồn tài liệu chủ yếu chính là những bộ sưu tập khổng lồ các tài liệu, chẳng hạn các tài liệu
https://thuviensach.vn
của UN(14) vốn đã được dịch sang nhiều thứ tiếng khác nhau. Nhưng chính mạng (web) đã khai quật được một kho báu – và các chỉ mục của Google giúp các kỹ sư có thể dễ dàng khai thác hàng tỉ văn bản, thực hiện được những cố gắng dù là tối tăm nhất liên quan đến việc dịch một văn bản hay một bài blog từ ngôn ngữ này sang ngôn ngữ khác. Thực tế, ngay cả một bài dịch nghiệp dư nhất cũng cung cấp được một số lượng kiến thức nhất định, nhưng các thuật toán của Google có khả năng tìm ra những bản dịch tốt nhất bằng cách sử dụng chính những nguyên lý đang được Google sử dụng để xác định những website quan trọng. “Tại Google,” Och nói, “chúng tôi có một số lượng dữ liệu khổng lồ và lượng tài nguyên tương ứng cần thiết được tính toán để xây dựng những hệ thống rất, rất, rất tốt.”
Och bắt đầu với một nhóm nhỏ các kỹ sư, và họ đã dành khoảng một năm từ nửa cuối năm 2004 đến nửa đầu năm 2005 để xây dựng các hệ thống và kiến tạo các thuật toán. Trong vài năm tiếp theo, thực tế, Google đã có một cuộc viễn chinh nhỏ nhằm tìm kiếm những người giỏi nhất trong lĩnh vực máy học, chuẩn bị thành lập một thành trì Trí tuệ Nhân tạo cho công ty. Vai trò chính thức của Och tại Google là một nhà khoa học của nhóm nghiên cứu, nhưng quan điểm của Google là không cần thiết phải nghiên cứu những gì xa xôi ngoài thực tế ứng dụng của sản phẩm.
Bởi vì Och và các cộng sự biết rằng họ sẽ phải tiếp cận một lượng dữ liệu khổng lồ, cả nhóm đã tạo ra một hệ thống dịch thuật hoàn toàn mới. “Một trong số những việc chúng tôi đã làm là xây dựng những mẫu hình ngôn ngữ lớn nhất trong lịch sử loài người.” Tiếp theo, nhóm bắt đầu đào tạo hệ thống. Để đánh giá tiến trình công việc, họ sử dụng một mô hình thống kê có thể dự đoán được từ tiếp theo khi được cung cấp một chuỗi các từ. Cứ mỗi lần lượng dữ liệu đào tạo được nhân đôi, thước đo số liệu tính toán các kết quả thành công của nhóm lại tăng 0,5%. “Và chúng tôi đã nhân đôi lượng dữ liệu của mình không biết bao nhiêu lần mà kể.” Để có được một bản dịch tương đối, Och cho biết, mô hình của bạn có thể sẽ cần đến một tỉ từ. Nhưng Google đã không dừng lại ở con số một tỉ đó.
https://thuviensach.vn
Với việc không yêu cầu sử dụng người bản ngữ, Google được thoải mái cung cấp tính năng dịch tự động sang cả những ngôn ngữ ít người biết đến nhất. “Bạn luôn có thể tìm được phương tiện để dịch Pháp-Anh hay Anh Tây Ban Nha, nhưng còn có thể ở đâu nữa nếu bạn muốn dịch từ tiếng Hindu sang tiếng Đan Mạch, Phần Lan, Na Uy?”
Một khó khăn dai dẳng của khoa học máy tính chính là nhận diện lời nói – tức là khả năng nghe và hiểu ngôn ngữ tự nhiên của máy tính. Google đã áp dụng các kỹ thuật của Och để dạy cho số lượng máy tính khổng lồ của mình làm thế nào để hiểu được những gì loài người nói. Công ty dùng một số điện thoại, 1-800-GOOG-411, cung cấp phiên bản miễn phí của dịch vụ vẫn được các công ty điện thoại sử dụng để yêu cầu trợ giúp về thông tin danh bạ. Bạn sẽ nói tên và thành phố của công ty bạn muốn gọi đến, Google sẽ đưa ra kết quả và hỏi bạn có muốn kết nối hay không. Đây hoàn toàn không phải là trao đổi một chiều. Bởi vì, sau khi cung cấp số điện thoại cho bạn, Google sẽ học được cách mọi người nói, và những phản hồi nhận được có thể giúp Google biết mình chưa làm đúng ở điểm nào. Cũng giống như với công cụ tìm kiếm, Google đang để người sử dụng dạy mình về thế giới. “Điều thuyết phục tôi đến với Google chính là khả năng xử lý một lượng lớn các thông tin, đặc biệt là những phản hồi từ người sử dụng của công ty”, Alfred Spector, gia nhập Google năm 2008 với vai trò là trưởng bộ phận nghiên cứu của Google, chia sẻ. “Chưa có nơi nào máy học lại có thể làm được những điều tương tự như ở Google.”
Sau nhiều năm, Google đã dần cải tiến “hệ thống máy học thực tế quy mô lớn” được đặt tên là “Seti”. Seti có nguồn gốc từ tên của tổ chức Nghiên cứu về trí thông minh ngoài Trái đất (Search for Extra Terrestrial Intelligence), có nhiệm vụ tìm kiếm trong vũ trụ về sự sống ngoài Trái đất; hệ thống của Google cũng hoạt động ở phạm vi vũ trụ khi tìm kiếm các tín hiệu về thế giới trong gương. Các chỉ mục của Google đã làm một việc phi thường khi thu gọn được một lượng dữ liệu lớn nhất từng được sử dụng trong các thí nghiệm máy học trước đó. Nỗ lực tham vọng nhất liên quan đến máy học trong kho lưu trữ các gói dữ liệu rất lớn dùng cho nghiên cứu
https://thuviensach.vn
hoặc thử nghiệm là một gói 4 triệu ví dụ được sử dụng để phát hiện gian lận và đột nhập. Hệ thống Seti của Google sử dụng một gói dữ liệu gồm 100 tỉ ví dụ.
Các chuyên gia nghiên cứu của Google sẽ phải thừa nhận rằng làm việc với một hệ thống máy học với kích cỡ như thế cũng giống như là đặt chân đến một vùng đất hoang vu chưa hề có dấu chân con người. Có vẻ như, sự tiến bộ ổn định trong hệ thống của Google đang đùa với những hậu quả mà nhà khoa học, nhà triết học Raymond Kurzweil đã cảnh báo. Kurzweil đã đưa ra những suy đoán về một “sự lập dị” đang đe dọa xảy ra nếu một hệ thống khổng lồ các máy tính có được sự hiểu biết. Larry Page rất quan tâm đến Kurzweil và là nhà tài trợ chính cho trường đại học do Kurzweil sáng lập, một tổ chức giáo dục có nhiệm vụ tiên đoán về một ngày trong tương lai, khi mà loài người chúng ta sẽ bị mất cây gậy chỉ huy lý trí vào tay những vật ngoại lai vô cơ.
Nên hiểu thế nào khi nói rằng Google “biết” điều gì đó? Liệu có phải hệ thống Seti của Google đang nói với chúng ta rằng, muốn tìm kiếm cuộc sống bên ngoài Trái đất, chúng ta không nên nhìn lên trời mà nên tìm ở hàng triệu máy chủ bên trong các trung tâm dữ liệu của Google?
“Đây là một câu hỏi vô cùng sâu sắc,” Spector nói. “Con người, thực sự, là những cái bao thật to chứa chủ yếu là nước đang chảy ngược xuôi trong rất nhiều những chiếc ống, cùng một vài tế bào thần kin h và những thứ khác. Nhưng chúng ta có tri thức. Bây giờ, hãy nhìn vào hệ thống máy tính của Google. Chúng là một tập hợp của rất nhiều công nghệ tự động, nên chúng biết ‘ba’ là một từ đồng nghĩa của ‘bố’, chúng biết từ tương đương của tiếng Anh là Father, và chúng cũng biết từ có cùng nghĩa này ở tiếng Đức và tất cả các ngôn ngữ khác. Chúng còn biết rất nhiều thứ khác nữa nhờ học hỏi từ những gì người ta gõ lên bàn phím”. Spector cũng liệt kê ra những thứ khác mà Google biết: Ví dụ, Google vừa mới giới thiệu một công nghệ tự động mới có khả năng xác định được ý định tự vẫn của bạn chỉ từ những tìm kiếm mà bạn thực hiện, trong trường hợp này Google sẽ cung cấp thông tin liên quan đến các nguồn cứu trợ. Ở đây, công cụ của
https://thuviensach.vn
Google lượm lặt những dấu hiệu khi quan sát hành vi của con người. Những dấu hiệu đó được đưa vào bộ não ảo của Google. Spector hứa rằng Google sẽ học thêm rất, rất nhiều trong những năm tới.
“Liệu những thứ này có thể tiến bộ đến mức độ nhận thức?”, Spector hỏi. “Những đứa cháu mười tuổi của tôi tin vào điều này. Chúng cho rằng Google biết rất nhiều. Nếu bạn hỏi bất cứ đứa trẻ nào ở lứa tuổi này, tôi nghĩ bọn trẻ sẽ trả lời là có.”
Vậy thì Spector, một nhà khoa học, nghĩ gì?
“Tôi e rằng đó không phải là câu hỏi có thể có được một câu trả lời khoa học,” ông nói. “Tuy nhiên, tôi tin rằng Google hiểu biết nhiều. Câu hỏi ở đây là, liệu chúng ta có xây dựng nên một trí tuệ đa năng chỉ ngồi một chỗ, nhìn xung quanh, rồi tự học hỏi tất cả các kỹ năng đó mà chẳng cần biết chúng là gì, một chẩn đoán y học hay...” Spector ngừng lại. “Nhưng còn cả một quãng đường dài,” ông nói. “Và điều đó có thể sẽ chưa thực hiện được trong quãng đời làm việc của tôi tại Google.” (Spector 55 tuổi khi cuộc trao chuyện trò này diễn ra vào đầu năm 2010.)
“Tôi nghĩ Larry rất muốn được nhìn thấy điều đó xảy ra,” ông nói thêm. Trên thực tế, Page đôi khi cũng đã nghĩ về những điều tương tự. Trở lại năm 2004, tôi đã hỏi Page và Brin về quan điểm của họ đối với tương lai của công cụ tìm kiếm Google. “Nó sẽ được cấy vào não người,” Page nói. “Khi bạn nghĩ về một thứ mà bạn chưa biết nhiều về nó, bạn sẽ tự động nhận được thông tin.”
“Đúng là như thế,” Brin nói. “Sau cùng, tôi xem Google như là một phương tiện giúp bổ sung kiến thức về thế giới cho bộ não của bạn. Ở thời điểm hiện tại, bạn bật máy tính và gõ một cụm từ, nhưng trong tương lai nó có thể còn dễ dàng hơn nữa, là khi xuất hiện những thiết bị mà bạn có thể điều khiển bằng giọng nói, hoặc sẽ có những chiếc máy tính có khả năng quan sát những gì đang xảy ra xung quanh chúng để gợi ý thông tin hữu dụng. Cuối cùng, bạn sẽ được cấy ghép. Lúc đó, khi bạn nghĩ đến một vấn đề, nó sẽ cho bạn biết câu trả lời.”
https://thuviensach.vn
Đó quả là một viễn cảnh thú vị, như được lấy ra từ các cuốn tiểu thuyết khoa học viễn tưởng. Nhưng Page đã làm được những điều đáng nể – chỉ trừ việc cấy ghép. Đầu năm 2010, khi được hỏi sẽ làm gì tiếp theo đối với công cụ tìm kiếm, Page trả lời rằng Google sẽ hiểu được sở thích của bạn để tìm ra những thứ bạn dù không biết nhưng muốn biết. Có nghĩa là khi thậm chí chính bạn không ý thức được mình đang tìm cái gì, Google sẽ nói cho bạn biết.
Page không nhắc đến những gì Google đã đạt được trên con đường này. Ben Gomes, một trong số những ngôi sao về tìm kiếm, đã chỉ cho một vị khách một thứ mà ông ta đang phát triển có tên gọi là “Tìm kiếm-lúc-bạn gõ”. Tính năng này cho phép kết quả tìm kiếm được trả về thậm chí trước cả khi bạn gõ xong câu hỏi của mình. Gomes bắt đầu gõ “fi nger shoes” – một thuật ngữ thường được dùng để miêu tả loại giầy dép Sergey Brin thường dùng khi chơi thể thao, có tráng cao su ở bên ngoài và có phần bao các ngón chân giống như đôi găng tay bao quanh các ngón tay của bạn. Tất nhiên, công cụ tìm kiếm Google, với tất cả những từ đồng nghĩa và kiến thức có được từ những lần “bấm dài” và cả những lần “bấm ngắn” của người sử dụng biết được thứ mà Gomes đang nói đến. Gomes chưa kịp gõ xong từ thứ hai, một trang với đầy những đường link – và cả quảng cáo – đã tự tin xuất hiện sau khi nhận định rằng ông đang muốn thông tin, hoặc có thể là một cơ hội mua sắm, liên quan đến “Vibram FiveFingers, lựa chọn cho đôi chân trần.” “Đó là một mối liên hệ khó hiểu giữa não của bạn và các kết quả,” Gomes nói. (Tháng 9 năm 2010, Google đã ra mắt sản phẩm này với tên “Google Instant”.)
“Việc tìm kiếm càng ngày càng trở nên kỳ diệu,” kỹ sư về tìm kiếm Johanna Wright chia sẻ. “Chúng tôi đang đạt được nhiều thành tựu đến mức chúng tôi sẽ làm được những điều mà mọi người thậm chí còn chưa bao giờ tưởng tượng đến.” Cô lấy một ví dụ. “Chẳng hạn bạn gõ từ ‘hamburger’. Ở thời điểm hiện tại, Google sẽ trả về cho bạn những công thức làm bánh hamburger. Nhưng sắp tới, chúng tôi còn đưa ra các kết quả về thực đơn, về những nơi bạn có thể mua một chiếc bánh mà không phải đi xa. Tôi gọi dự
https://thuviensach.vn
án này là Những chiếc bánh Phúc bồn tử (Blueberry Pancakes) vì nếu tôi muốn tìm thông tin về những thứ này, công cụ tìm kiếm sẽ nói cho tôi biết về một cửa hàng làm bánh ở Los Altos và tôi sẽ đi đến đó. Đây chỉ là ví dụ – Google đang càng ngày càng hiểu bạn và có thể đáp ứng rất nhiều, rất nhiều những nhu cầu của bạn.”
Điều này giúp Google có được sự chủ động trong rất nhiều quyết định, dù lớn hay nhỏ, mà mọi người cần đưa ra trong cuộc sống hằng ngày. Hãy nhớ, hơn 70% các tìm kiếm ở Mỹ được thực hiện trên Google, và ở một số quốc gia con số này còn cao hơn. Điều này thể hiện sức mạnh của một công ty được hai sinh viên thành lập mới chỉ hơn một thập kỷ trước đây. “Hiểu theo một cách nào đó, chúng tôi chịu trách nhiệm trước mọi người về những gì họ cần,” Udi Manber chia sẻ. “Cứ hễ khi nào họ không tìm thấy thứ họ cần, đó là lỗi của chúng tôi. Đây là một trách nhiệm lớn lao. Cũng giống như những người bác sĩ chịu trách nhiệm trước sinh mạng của bệnh nhân.”
Có thể, Manber chợt nghĩ, dù các bộ não siêu việt của Google có ý định tốt như thế nào đi nữa, nó không nhất định đã là một điều tốt cho một thực thể bất kỳ khi có câu trả lời đó, cho dù nó có được cắm thẳng vào não của bạn hay không.
“Nó có thể khiến bạn ngạc nhiên,” Udi Manber nói, “nhưng tôi hoàn toàn đồng ý với điều này. Và nó khiến tôi sợ hãi.”
https://thuviensach.vn
PHẦN 2:
NỀN KINH TẾ GOOGLE
Giải mã lợi nhuận từ Internet
1.
“Kế hoạch kinh doanh là cái gì?” Giám đốc điều hành Google, Eric Schmidt gọi đó là “chiến lược bí ẩn”. Nó là bí mật lớn nhất của Google, có lẽ còn phải được bảo vệ tốt hơn cả những bí mật phía sau thuật tra cứu. Những người được biết nó – tức là những người làm việc tại Google – được hướng dẫn khá cứng rắn để biết giữ mồm giữ miệng. Người ngoài, nếu có nghi hoặc về bí mật của Google, cũng không hề nhận được một dấu hiệu xác nhận nào hết. Điều khiến cho việc giữ kín này được dễ dàng hơn là hầu như không có một chuyên gia nào theo sát việc kinh doanh Internet lại tin rằng bí mật của Google là khả thi. Điều mà Google giấu kín là cách nó giải mã để kiếm tiền trên Internet. Google đã sáng tạo ra một trong những sản phẩm thành công nhất trong lịch sử doanh nghiệp và giờ thì hãng đang hái ra tiền.
David Krane, gia nhập Google năm 2000 với vai trò là người đại diện báo chí đầu tiên của công ty, chịu trách nhiệm duy trì vòng bí mật và ngăn cản các nỗ lực tìm hiểu. Mọi công ty anh từng làm việc trước đây đều cực kỳ háo hức khi được nhấn mạnh những mặt tích cực liên quan tới kết quả tài chính. Nhưng ở Google, công việc của anh lại là đánh lạc hướng báo chí khỏi các tin tốt. “Chúng tôi đã giải được một trong những câu đố chưa có lời đáp trên Internet – kiếm thật nhiều tiền theo cách mà người dùng yêu thích và đang cố gắng để ngăn cản các công ty khác khám phá ra điều này, càng lâu càng tốt”, Krane nói.
https://thuviensach.vn
Sự kín đáo này hoàn toàn phù hợp với bản tính ưa giữ bí mật mọi lúc mọi nơi của Larry Page, nhưng Schmidt, người gia nhập Google năm 2001, thậm chí còn biến nó thành ưu tiên hàng đầu. Vị CEO mới lo lắng về Microsoft. Vào những năm 1990, khi còn đang làm việc tại Sun Microsystems và sau đó là lãnh đạo của Novell, một công ty chuyên về kết nối mạng (Networking), Schmidt đã được chứng kiến những gì có thể xảy ra khi một người khổng lồ công nghệ cao bị thức tỉnh bởi một thứ đe dọa kế sinh nhai của mình: mạng Internet. Giờ thì phạm vi thành công của Google đặt tìm kiếm vào cùng danh mục với mối đe dọa đó; Microsoft khi đó chưa biết được điều này. Sớm hay muộn gì thì gã khổng lồ cũng sẽ biết được bí mật này. Nhưng Schmidt muốn giữ kín nó càng lâu càng tốt.
Bí mật được giữ tới ngày 1 tháng 4 năm 2004. Hệ quả của việc chuyển thành công ty đại chúng là Google buộc phải chia sẻ thông tin nội bộ của mình với các ngân hàng có khả năng sẽ thực hiện IPO(1). Những người chịu trách nhiệm về tài chính của Google đã triệu tập các ngân hàng tại trụ sở chính, khi đó còn đóng tại Mountain View. Ngay trước buổi họp, Giám đốc tài chính George Reyes và Giám đốc phụ trách việc tối ưu hóa kinh doanh Lise Buyer đã có kế hoạch cho việc tiết lộ bí mật của Google.
Mở đầu cuộc họp, Reyes nói lời chào mừng. Bởi vì các ngân hàng đã đánh một ván cờ lớn khi vẫn đặt bút ký dù chưa được nhìn thấy kết quả kinh doanh nên anh sẽ đi thẳng vào các con số. Rồi Reyes đưa slide lên. “Mọi người có thể nghe thấy cả tiếng chiếc đinh ghim rơi”, Buyer nhớ lại. Các bản slide chỉ ra rằng Google thực ra đang tạo ra lợi nhuận khá ổn. Không đến mức chấn động nhưng vẫn cao hơn dự đoán, nhất là đối với một thương vụ kinh doanh Internet cung cấp một dịch vụ miễn phí chỉ được hỗ trợ nhờ quảng cáo. Các ngân hàng lắng nghe rất lịch sự, nhưng có thể thấy rõ rằng họ đang rất hài lòng với những con số được đưa ra và đang nhẩm tính lại trong đầu.
Rồi Reyes nói với các ngân hàng rằng anh xin lỗi, nhưng do sơ suất, anh đã dùng nhầm slide. Anh có thể trình bày con số thực được không? Một bảng cân đối kế toán xuất hiện với con số thể hiện doanh thu và lợi nhuận
https://thuviensach.vn