"
Big Data - Dữ Liệu Lớn | Bernard Marr PDF EPUB
🔙 Quay lại trang tải sách pdf ebook Big Data - Dữ Liệu Lớn | Bernard Marr PDF EPUB
Ebooks
Nhóm Zalo
a
Mục lục
1. Mở đầu - Chào mừng đến với một thế giới thông minh hơn 2. 1. Kinh doanh thông minh hơn
3. 2. S = Start with strategy - Khởi đầu với chiến lược 4. 3. M = Measure metrics and data - Đo lường các chỉ số và dữ liệu
5. 4. A = Apply analytics - Áp dụng các phương pháp phân tích 6. 5. R = Report results - Báo cáo kết quả
7. 6. T = Transform business - Biến đổi doanh nghiệp 8. Lời kết
Mở đầuChào mừng đến với một thế giới thông minh hơn
T
hế giới đang ngày càng trở nên thông minh hơn.
Chúng ta có thể nhận thấy sự tiến hóa ở khắp mọi nơi, không ngoại trừ bất kỳ ngành nghề hay lĩnh vực nào. Hãy xem xét một ngành nghề cổ xưa và lâu đời, chẳng hạn như đánh bắt cá. Tuy loài người đã bắt đầu câu cá từ thuở sơ khai, nhưng mãi đến thế kỷ XVI, các ngư dân mới sở hữu những con thuyền đủ sức băng qua biển lớn. Sự tiến bộ này đã lập tức thay đổi vận mệnh của nghề đánh bắt cá, đồng thời lần đầu tiên mang lại những mẻ cá lớn và có thể sinh lời. Đoàn thuyền cứ thế tiến ra ngư trường, chỉ với một chiếc la bàn, kính lục phân cùng “bí quyết gia truyền” được truyền lại qua nhiều thế hệ. Nếu ra khơi vào ban đêm, họ sẽ vận dụng các kỹ thuật định hướng và dựa theo các chòm sao để xác định lộ trình đến đúng vùng lân cận. Khi các ngư dân đến ngư trường, họ sẽ thả lưới và hy vọng điều tốt đẹp nhất.
Đến cuối thế kỷ XIX, ngành đánh bắt cá được thương mại hóa. Những con thuyền nhỏ nhường chỗ cho các con tàu lớn với khả năng xử lý thành phẩm ngay trên boong; việc phát hiện ra kinh độ và vĩ độ giúp cho việc định hướng trên biển trở nên dễ dàng hơn nhiều; và trong vài thập niên vừa qua, công nghệ đã biến đổi ngành đánh bắt cá từ nghệ thuật trở thành một môn khoa học. Những con thuyền đánh cá hiện đại được trang bị công nghệ phong phú, sử dụng các hệ thống định vị công nghệ cao và cả GPS. Các bộ cảm biến nhỏ thường được gắn vào thân cá để dò theo vị trí của đàn cá vào bất kỳ thời điểm nào, còn hệ thống định vị dưới nước được dùng để xác định mật độ, địa điểm và thời điểm giăng lưới. Những ngư dân hiện đại biết nơi nào có cá; họ biết nơi họ sẽ đến vào ngày mai và khi nào cần thả lưới để thu về mẻ cá nhiều nhất có thể. Nghề
đánh cá đã “tiến hóa” để trở nên thông minh hơn. Và đây mới chỉ là một ví dụ. Ngày nay, thế giới đang thông minh hơn trong mọi thứ, từ thành tích thi đấu thể thao cho đến việc chăm sóc sức khỏe tại nhà.
Ngay cả chuyện yêu đương và việc làm cha mẹ cũng thông minh hơn.
THỂ THAO THÔNG MINH HƠN
Hiện nay, công nghệ thông minh đang được sử dụng rộng rãi trong thể thao để tìm kiếm và chiêu mộ nhân tài – cũng như giám sát và cải thiện thành tích – cả trong giới nghiệp dư lẫn chuyên nghiệp. Giờ đây, chúng ta có thể sản xuất một quả bóng rổ với hơn 200 bộ cảm biến bên trong để cung cấp phản hồi chi tiết về thành tích cho cầu thủ và huấn luyện viên. Trong môn quần vợt, một hệ thống tên là SlamTracker có thể ghi nhận thành tích của tay vợt, thông qua cung cấp thông số về thời gian thực và phân tích tổng hợp về trận đấu. Nếu đã từng xem môn bóng bầu dục (hiệp hội hoặc liên đoàn), bạn có lẽ sẽ thắc mắc không biết tiếng gì va chạm giữa các lớp giáp vai trên người cầu thủ – đó chính là hệ thống theo dõi GPS, cho phép ban huấn luyện viên đánh giá thành tích theo thời gian thực. Thiết bị này sẽ đo tốc độ trung bình của cầu thủ, bất kể cầu thủ đó đang thi đấu trên hay dưới phong độ bình thường; cũng như nhịp tim, để nhận diện các vấn đề tiềm ẩn trước khi chúng xảy ra. Toàn bộ những dữ liệu trên có thể giúp huấn luyện viên tránh chấn thương và đưa ra các quyết định thay người phù hợp. Công nghệ tương tự cũng xuất hiện ở Giải bóng đá Ngoại hạng Anh và được sử dụng trong nhiều bộ môn Olympic, chẳng hạn như đua xe đạp.
Nhưng công nghệ không chỉ dành cho dân chuyên nghiệp. Có rất nhiều thiết bị mang theo người có thể theo dõi tình trạng sức khỏe và thể trạng khi chúng ta di chuyển. Ví dụ như tôi đang đeo một chiếc vòng đeo tay theo dõi sức khỏe “Up”; nó cho tôi biết mình đã đi được bao nhiêu bước mỗi ngày, đốt cháy được bao nhiêu calo và hằng đêm có ngủ ngon không. Nó được đồng bộ với cân sức khỏe, để mỗi khi tôi tăng cân, nó sẽ nhắc tôi hoạt động nhiều hơn hoặc ăn ít đi.
SỨC KHỎE THÔNG MINH HƠN
Việc chăm sóc sức khỏe cũng đang trở nên thông minh hơn, và điều đó đã cách mạng hóa cuộc sống của chúng ta.
Giáo sư Larry Smarr, một trong những nhà khoa học máy tính có ảnh hưởng nhất tại Mỹ, cũng là người được giám sát nghiêm ngặt nhất trên thế giới, đã tự chẩn đoán được bệnh Crohn1 – rất lâu trước khi bất kỳ triệu chứng nào xuất hiện và vừa kịp để ông kiểm soát tình trạng của mình hiệu quả. Smarr khẳng định:
“Trong một thế giới mà bạn có thể chứng kiến điều mình đang làm với bản thân trong khi đang chuyển động, chúng ta có thể hy vọng rằng mọi người sẽ có trách nhiệm hơn với chính họ, để giữ cho bản thân khỏe mạnh. Cứ như thể chúng ta đang sống trong khởi nguyên của một thế giới y học hoàn toàn mới, và kết quả sẽ là một xã hội khỏe mạnh hơn rất nhiều, tập trung duy trì cơ thể tráng kiện hơn là chữa bệnh khi đã quá muộn2”
Khả năng tự theo dõi sức khỏe của bản thân này đang báo hiệu một ranh giới mới đầy thú vị về y học phòng bệnh dựa trên dữ liệu.
Từ lâu, chúng ta đã hiểu rằng: Trên lý thuyết, phòng bệnh hơn chữa bệnh. Nhưng chính sự phối hợp giữa công nghệ và sức khỏe mới biến lý thuyết đó thành thực hành. Trong năm nay, dự kiến sẽ có 42 triệu thiết bị đeo thông minh theo dõi sức khỏe trao đến tay người dùng trên khắp thế giới. Theo hãng phân tích thị trường ABI Research: “Cho tới năm 2019, tổng số tiền chi cho các thiết bị hoạt động tiêu dùng không dây này sẽ tăng trưởng thành một thị trường trị giá 52 triệu đô-la.” Các dịch vụ dựa trên công nghệ điện toán đám mây như Ginger.io đã cho phép bên cung cấp dịch vụ chăm sóc sức khỏe theo dõi bệnh nhân của họ thông qua những ứng dụng cảm ứng trên điện thoại thông minh 3. Proteus cũng phát minh ra máy quét “có thể nuốt được” với kích thước chỉ bằng hạt cát, dùng để thăm dò xem bệnh nhân uống thuốc khi nào và ra sao. Thứ này cũng mang lại cho bên cung cấp thông tin về “tỷ lệ tuân thủ” – tức mức độ thường xuyên mà bệnh nhân tuân theo chỉ thị của bác sĩ – và thậm chí có thể báo cho người nhà nhắc nhở họ.
Nhưng không chỉ có khả năng giám sát và kiểm soát sức khỏe của chúng ta tốt hơn; Dữ Liệu Lớn, các phân tích và cuộc cách mạng thông minh hiện đang thay đổi ngành y tế, với những phát minh như máy quét tình trạng chấn thương sọ não tiên tiến nhất, các hệ thống phát hiện và chẩn đoán sinh non cũng như ung thư. Khả năng là vô tận.
NHỮNG NGÔI NHÀ THÔNG MINH HƠN
Mọi thứ trong nhà cũng đang trở nên thông minh hơn, từ những chiếc xe hơi mà chúng ta lái cho đến hệ thống sưởi, thiết bị điện tử, đồ gia dụng và thậm chí là thảm trải sàn.
Sự phát triển từ cơ bản đến thông minh đặc biệt nổi bật đối với xe hơi. Ban đầu, mẫu xe Model T của Ford chỉ có màu đen, bộ sang số bằng cần với vài nút bấm và không có đai an toàn. Nhưng ngày nay, chúng ta đã có những chiếc xe với cả một bảng điều khiển giống buồng lái máy bay, với các máy quay và cảm biến giúp đỗ xe dễ dàng, báo hiệu cho tài xế biết họ đang chạy quá sát lề đường hoặc xe khác. Một số xe có thể tự động đỗ song song và tự động phanh. Số khác lại tích hợp thông tin giao thông và tự điều chỉnh lại lộ trình tốt hơn để tránh các điểm mù giao thông hoặc tai nạn. Các bộ cảm biến trong động cơ sẽ theo dõi cách bạn lái xe, từ đó sẽ giảm (hoặc tăng) mức bảo hiểm và chủ động điều chỉnh các khoảng thời gian chăm sóc, bảo trì dựa trên phong cách lái của bạn.
Còn có các bộ điều chỉnh nhiệt thông minh trong nhà, chỉ sưởi ấm các khu vực có người sử dụng. Nhiệt độ trong nhà có thể thay đổi khi bạn đang đi làm, do đó ngôi nhà vẫn ấm cúng khi bạn trở về vào một tối mùa đông. Khả năng theo dõi và chủ động điều chỉnh nhiệt độ này có thể tiết kiệm tiền và năng lượng. Hiển nhiên, việc giải quyết khủng hoảng năng lượng không chỉ trông chờ vào việc chúng ta tìm ra những nguồn năng lượng mới như gió và mặt trời, mà còn phụ thuộc vào việc chúng ta tiết kiệm năng lượng đang có và sử dụng nó hiệu quả hơn.
Tivi thông minh sử dụng chức năng nhận diện khuôn mặt để đảm bảo con bạn không bao giờ xem thứ gì không phù hợp với độ tuổi;
và thảm thông minh có thể nhắc bạn không nên để bố mẹ già yếu của mình pha cà phê vào mỗi buổi sáng như thường ngày.
Xét đến tất cả những thứ như đồ chơi, thiết bị điện tử và các vật dụng nhỏ thông minh, ngày nay chúng đều kết nối với Internet nhiều hơn là với con người. Và tất cả những món đồ thông minh đó đều đang thu thập dữ liệu, cũng như “giao tiếp” với nhau.
YÊU THÔNG MINH HƠN
Ngay cả một thứ mang tính cá nhân và nhiệm màu như tình yêu cũng đang trở nên thông minh hơn. Mọi người đều hy vọng tìm thấy tri kỷ của mình, nhưng công cuộc tìm kiếm ấy lại được thực hiện một cách gián tiếp. Trang hẹn hò trực tuyến eHarmony kết nối mọi người dựa trên 29 biến số khác nhau như đặc điểm tính cách, hành vi, tín ngưỡng, giá trị và kỹ năng xã hội. Mỗi người tham gia eHarmony phải hoàn thành một bảng điều tra lý lịch toàn diện, qua đó cung cấp dữ liệu để mô hình phân tích tìm ứng viên tiềm năng.
Amy Webb, một chuyên gia kỹ thuật số người Mỹ, thậm chí còn tiến xa hơn một bước với các thuật toán dữ liệu trực tuyến. Sau một cuộc hẹn cực kỳ tồi tệ, khi “Bạch mã Hoàng tử” của cô gọi những món đắt tiền nhất trong thực đơn, thưởng thức chúng và biến mất sau khi đi vệ sinh, Webb đã tự tạo ra hệ thống tính điểm của riêng cô, dựa trên những điều mà cô xem trọng ở người bạn đời tiềm năng. Thêm vào đó, cô phân tích các hồ sơ khác để xem có điều gì hấp dẫn không; thử nghiệm những thay đổi trong chính hồ sơ của cô để xem có thay đổi gì về số lượng, chất lượng của những lời hỏi thăm không. Cô sẽ chỉ nhận lời hẹn hò với một người đạt một điểm số nhất định. Và cách đó đã hiệu quả… Giờ đây, Amy đã có một cuộc hôn nhân hạnh phúc và một cô con gái4.
LÀM CHA MẸ THÔNG MINH HƠN
Nghệ thuật làm cha mẹ vốn phức tạp cũng trở nên thông minh hơn. Để xác định và giảm thiểu các nguy cơ trước và sau khi sinh, nhiều đứa trẻ trên khắp thế giới đang được theo dõi liên tục thông qua vô số chỉ số và điểm dữ liệu gồm nhịp tim và tình trạng hô hấp. Những
chỉ số quan trọng trên có thể dự báo nhiễm trùng đến 24 giờ trước khi đứa trẻ cho thấy bất kỳ triệu chứng rõ ràng nào, đồng thời cho phép bác sĩ sớm can thiệp và thường là cứu được tính mạng.
Khi đứa bé đã chào đời bình an, nó cũng có thể ngủ trên một tấm đệm đầy các cảm biến để theo dõi tiến trình thở, nhịp tim và báo cho các bậc phụ huynh nếu có điều gì không ổn. Hãy hình dung xem ta có thể tránh được bao nhiêu ca đột tử bi thương ở trẻ sơ sinh với công nghệ thông minh này. Thậm chí, chúng ta có thể mua tã lót kỹ thuật số, chúng sẽ gửi thông báo đến điện thoại thông minh khi đứa bé cần thay tã. Hiển nhiên, người cha người mẹ tốt thực sự chẳng cần tới thông báo đó, nhưng các loại tã thế hệ mới nhất này sẽ tự động phân tích nước tiểu của trẻ và cảnh báo cho bậc cha mẹ về lượng na-tri tăng cao, có thể là do mất nước, cũng như khi trẻ bắt đầu bị nhiễm khuẩn – và tất cả những điều trên thậm chí sẽ diễn ra trước cả khi triệu chứng xuất hiện.
Sự kết hợp giữa dữ liệu và công nghệ đang nhanh chóng thay đổi thế giới của chúng ta, khiến nó thông minh hơn. Và việc kinh doanh cũng phải trở nên thông minh hơn.
Hãy quay lại phép so sánh với nghề đánh bắt cá một chút… Ban đầu, tính cạnh tranh của nghề đánh cá còn khá thấp và lượng cá cũng còn nhiều, nên ngư dân không cần phải đến chính xác một địa điểm mới được tận hưởng một ngày bội thu. Với kinh nghiệm, công cụ và số lượng cá biển, họ sẽ thành công, trừ khi gặp phải thời tiết cực kỳ xấu. Nhưng ngày nay, với tình hình cạnh tranh gay gắt và lượng cá có hạn, cần được kiểm soát một cách có trách nhiệm – các ngư dân phải “tiến hóa” và trở nên thông minh hơn. Và đó cũng là yêu cầu đối với mọi doanh nghiệp trên mọi lĩnh vực.
Hiện nay, các doanh nghiệp thực sự thành công hiểu rõ khách hàng của họ ở đâu, và quan trọng hơn là họ đang làm gì và tiến tới đâu. Họ biết điều gì đang thực sự diễn ra, và họ cho phép thông tin đó dẫn đường cho chiến lược, cũng như thông báo cho họ khi cần ra quyết định.
Những doanh nghiệp nào không đi theo cuộc cách mạng THÔNG MINH sẽ bị bỏ lại phía sau.
CHÚ THÍCH
1. Bệnh Crohn là một bệnh viêm đường ruột. Nó gây ra chứng viêm màng đường tiêu hóa, có thể dẫn đến đau bụng, tiêu chảy và thậm chí cả suy dinh dưỡng trầm trọng.
2. BBC Two (2013) Horizon Monitor Me (tạm dịch: Chân trời quan sát tôi), do Tiến sĩ Kevin Fong tường thuật (2013).
3. Palmer, S., White, E., Romanski, P., Bendict, K. và Gardner, D. (2014) Intergrating Consumer Wearable Health Devices Will Drive Healthcare Big Data Adoption (tạm dịch: Các thiết bị sức khỏe tiêu dùng tích hợp mang theo người sẽ kéo theo sự thích nghi với y tế kiểu Dữ Liệu Lớn), ABI Research.
http://bigdata.ulitzer.com/node/3058905.
4.
http://www.ted.com/talks/amy_webb_how_i_hacked_online_dating.h tml.
1Kinh doanh thông minh hơn
D
ữ Liệu Lớn là linh hồn của cuộc cách mạng thông minh. Ý tưởng cơ bản đứng sau cụm từ “Dữ Liệu Lớn – Big Data” chính là: Tất cả mọi thứ chúng ta làm đều đang dần để lại “dấu vết” kỹ thuật số (hay dữ
liệu) mà chúng ta có thể sử dụng và phân tích để trở nên thông minh hơn. Những động lực thúc đẩy thế giới mới đầy dũng cảm này đang tiếp cận một khối lượng dữ liệu đang gia tăng chưa từng có, cũng như năng lực công nghệ đang không ngừng gia tăng nhằm khai thác khối dữ liệu đó cho sự hiểu biết về thương mại.
Không một chút nghi ngờ rằng Dữ Liệu Lớn đang thay đổi thế giới. Nó đã hoàn toàn biến chuyển cách chúng ta sống, tìm kiếm tình yêu, chữa trị ung thư, nghiên cứu khoa học, cải thiện thành quả, điều hành các thành phố, quốc gia và hoạt động kinh doanh. Kết quả là vô vàn những lời cường điệu và bàn tán về Dữ Liệu Lớn xuất hiện. Tất cả mọi người đều đang bàn về nó. NÓ là chủ đề nóng được thảo luận trong mọi phòng họp cấp cao, mọi ấn phẩm kinh doanh từ The Economist, Fortune cho đến Harvard Business Review. Dữ Liệu Lớn thậm chí còn đang mở đường tiến vào truyền thông chính thống.
Nhưng bất chấp những ồn ào xung quanh Dữ Liệu Lớn, hầu hết mọi người vẫn không thực sự hiểu rõ nó và rất ít người biết phải làm gì với nó. Cá nhân tôi không thích thuật ngữ này, vì nó quá giản dị và dễ gây hiểu nhầm. Thoạt trông, chúng ta đang dõi theo và lưu trữ dữ liệu về mọi thứ, nên ta có khả năng tiếp cận với lượng lớn dữ liệu – từ đó dẫn đến thuật ngữ Dữ Liệu Lớn. Nhưng giá trị thực sự không phải là lượng lớn dữ liệu, mà là điều chúng ta có thể làm với chúng ngay lúc này. Lượng dữ liệu không tạo ra sự khác biệt, mà chính do khả năng phân tích các tập dữ liệu khổng lồ và phức tạp của chúng ta – một điều mà trước đây chúng ta không thể làm được. Những cách tân như điện toán đám mây kết hợp với tốc độ
mạng được cải thiện cùng các công nghệ sáng tạo nhằm phân tích dữ liệu đã mang đến một khả năng mới, giúp biến các khối dữ liệu đồ sộ, phức tạp thành giá trị. Không những thế, giờ đây việc phân tích có thể được tiến hành mà không cần phải mua hay chế tạo những siêu máy tính lớn. Điều này có nghĩa rằng bất kỳ doanh nghiệp, chính phủ, hay cá nhân nào cũng đều có thể sử dụng Dữ Liệu Lớn để cải thiện quá trình đưa ra quyết định.
Điều đặc biệt hiệu quả chính là khả năng phân tích của chúng ta đối với cái gọi là “dữ liệu phi cấu trúc” (chi tiết hơn trong chương 3). Về cơ bản, dữ liệu phi cấu trúc là dữ liệu mà chúng ta không thể dễ dàng lưu trữ và lập danh mục theo các định dạng hay cơ sở dữ liệu truyền thống, bao gồm trao đổi qua e-mail, các bài đăng trên các phương tiện truyền thông xã hội, nội dung video, hình ảnh, ghi âm giọng nói, âm thanh… Kết hợp loại dữ liệu lộn xộn, phức tạp này với các dữ liệu truyền thống khác, chúng ta sẽ thu được rất nhiều giá trị. Nhiều công ty đang bắt đầu sử dụng các phương pháp phân tích Dữ Liệu Lớn để bổ sung vào các phân tích dữ liệu truyền thống, nhằm đa dạng hóa và nâng cao hiểu biết về khách hàng, đồng thời đưa ra các quyết định thông minh hơn.
Do vậy, ý nghĩa thực sự của Dữ Liệu Lớn phải là Dữ Liệu THÔNG MINH (Dữ Liệu SMART). Và trong khi tôi nghĩ rằng thuật ngữ Dữ Liệu Lớn sẽ biến mất, thì chắc chắn đang ngày càng có nhiều người nghĩ ra và sử dụng thuật ngữ Dữ Liệu SMART.
AI ĐANG SỬ DỤNG DỮ LIỆU LỚN?
Các ông chủ lớn trong ngành, bao gồm Amazon, Google, Walmart và Facebook, đang thu hút rất nhiều sự chú ý. Chẳng hạn, Wallmart đang xử lý hơn 1 triệu giao dịch khách hàng mỗi giờ và nhập chúng vào các cơ sở dữ liệu, với khối lượng ước tính hơn 2,5 tỉ petabyte5. Công ty này hiện có thể kết hợp dữ liệu từ nhiều nguồn khác nhau, bao gồm dữ liệu mua của khách hàng trong quá khứ cùng vị trí số điện thoại của họ, các ghi chép kiểm soát tồn kho nội bộ của Walmart, truyền thông xã hội và thông tin từ các nguồn bên ngoài như thời tiết và đề xướng các khuyến mãi thích hợp. Chẳng hạn,
nếu bạn từng mua bất kỳ mặt hàng nào liên quan đến đồ nướng thịt tại Walmart, trong vòng bán kính ba dặm tính từ một cửa hàng Walmart có sẵn dụng cụ vệ sinh đồ nướng thịt và trời đang nắng đẹp, thì bạn có thể sẽ nhận được một phiếu giảm giá dụng cụ vệ sinh đồ nướng thịt được gửi đến điện thoại của bạn.
Trong một trường hợp khác từ khách hàng của tôi, một công ty viễn thông hàng đầu đang sử dụng phân tích Dữ Liệu Lớn để dự báo mức độ hài lòng của khách hàng và dự báo khách hàng có nguy cơ rời mạng. Dựa trên các hành vi gọi và nhắn tin, cũng như qua các phân tích truyền thông xã hội, công ty có thể xếp khách hàng vào nhiều phân nhóm khác nhau. Các phân tích cho thấy các đối tượng trong một nhóm khách hàng cụ thể nhiều khả năng sẽ hủy hợp đồng và chuyển sang đối thủ cạnh tranh của họ. Thông tin cực kỳ hữu ích này hiện đang giúp công ty theo dõi sát sao mức độ hài lòng của các khách hàng này, cũng như ưu tiên cho những hoạt động ngăn khách hàng rời mạng và chăm sóc họ tốt hơn.
Ngay đến những chiếc xe hạng trung ngày nay cũng có khoảng 40 bộ cảm biến siêu nhỏ để đo hiệu suất. Các thiết bị điện tử này thường chiếm khoảng 1/3 giá thành của một chiếc xe mới. Tất nhiên, toàn bộ dữ liệu này đều được các nhà sản xuất xe hơi tạo ra, thu thập và phân tích để mang lại những lợi thế cạnh tranh đáng kể cho họ. Một nhà sản xuất xe hơi làm việc với một công ty phân tích bên ngoài nhận thấy thiết bị cảm biến trong bình xăng do một nhà cung cấp tại Đức sản xuất hoạt động không hiệu quả. Nhà sản xuất lẽ ra có thể gọi cho bên cung cấp và yêu cầu họ sửa nó, nhưng rồi, việc cải tiến đã được chuyển giao lại cho những nhà sản xuất xe hơi khác có cùng bên cung cấp đó. Như vậy, thay vì nhà sản xuất kia phải tạo ra một “bản vá” phần mềm để khắc phục vấn đề, họ đã được cấp bằng sáng chế cho việc khắc phục đó, rồi bán lại bằng sáng chế cho bên cung cấp6.
Dữ Liệu Lớn đang thay đổi bản chất của công việc kinh doanh, từ sản xuất, y tế, bán lẻ cho đến nông nghiệp và còn nhiều hơn thế. Tốc độ của dữ liệu và việc thu thập dữ liệu trong mọi hoạt động mà chúng ta có thể tưởng tượng ra cho thấy rằng ngày càng có nhiều
cơ hội để tinh chỉnh các thủ tục, hoạt động nhằm khai thác hiệu suất một cách triệt để.
CÁC DOANH NGHIỆP ĐANG SỬ DỤNG DỮ LIỆU LỚN NHƯ THẾ NÀO?
Những ngành nghề khác nhau đã đáp lại lời kêu gọi theo nhiều cách khác nhau. Ngành bán lẻ và bán hàng đang tìm cách thu thập thông tin nhiều nhất có thể về cuộc sống của khách hàng, cũng như đáp ứng các nhu cầu luôn thay đổi của họ sao cho hiệu quả hơn. Ngành sản xuất đang tìm cách tổ chức các hoạt động tốt hơn. Việc cài đặt các thiết bị định chuẩn có thể được ghi nhận và điều chỉnh, đồng thời các môi trường lưu trữ sản phẩm được giám sát nhằm xác định các điều kiện tối ưu nhất để làm giảm tối thiểu hư hỏng và lãng phí.
Đối với các doanh nghiệp toàn cầu, điều này có thể đồng nghĩa với việc thu thập và phân tích dữ liệu từ các nhà máy trên khắp thế giới, cho phép họ tìm hiểu những sai lệch cực nhỏ và hiểu rõ kết quả.
Ví dụ, vào năm 2013, hãng dược phẩm khổng lồ Merck đã sử dụng phân tích để dần cắt bỏ những khoản lãng phí do sai lệch trong điều kiện môi trường sản xuất. Họ phải mất đến ba tháng cùng 15 tỉ phép tính trên mỗi dữ liệu sản xuất đơn lẻ từ 5,5 triệu thùng vắc-xin. Điều này cho phép họ khám phá ra những điều kiện tối ưu trong quá trình lên men và gia tăng đáng kể hiệu quả vắc-xin, nhất là khi FDA7 đã thông qua các đề xuất thay đổi trong quá trình sản xuất.
Trong ngành công nghiệp xe hơi, một báo cáo năm 2014 do Trung tâm Nghiên cứu chế tạo xe hơi thực hiện khẳng định rằng nhiều bước tiến đã có thể xuất hiện thông qua các giải pháp IT nâng cao; và Dữ Liệu Lớn là đại diện cho “một động cơ đổi mới”. Báo cáo này nhấn mạnh tính chất phức tạp đang gia tăng trong ngành xe hơi, xem đó như thách thức lớn nhất mà các hãng sản xuất xe hơi phải đối mặt.
Hiệu suất của mọi cỗ máy – cũng như mọi cá nhân – tham gia trong quá trình sản xuất đều có thể được ghi nhận, bởi vậy các doanh
nghiệp sẽ biết được điều gì hiệu quả và có thể tiến hành cải tiến ở những điểm cần thiết.
Và trong nông nghiệp, việc phân tích dữ liệu đang giúp ngành này hoàn thành thử thách gia tăng 60% sản lượng thực phẩm trên toàn cầu, mà các nhà dự báo cho rằng rất cấp thiết vào năm 2050, do gia tăng dân số. John Deere, một nhà sản xuất máy kéo và máy móc nông nghiệp, đã gắn các bộ cảm biến vào những chiếc máy của mình. Các chủ trang trại có thể truy cập vào trang myjohndeere.com để xem dữ liệu, và các dịch vụ Farmsight sẽ giúp họ thiết lập điều kiện môi trường tối ưu cho cây trồng. Bên cạnh đó, John Deere còn sử dụng dữ liệu để dự báo nhu cầu đối với phụ tùng thay thế.
Tất nhiên, trong kinh doanh, một khi sản phẩm đã được phát triển và sản xuất, chúng ta sẽ cần bán và phân phối nó. Hàng petabyte dữ liệu về khách hàng – bao gồm cả bạn và tôi – cũng được các nhà bán lẻ lớn thu thập để biết được ai đang muốn mua thứ gì, ở đâu và khi nào. Ví dụ, Amazon sử dụng hệ thống S38 để theo dõi hàng triệu mục hàng hóa lưu trữ, thuộc hàng tá kho bãi và trung tâm phân phối rải rác khắp thế giới. Nhân viên có thể kiểm tra hàng phân phối theo thời gian thực để xem món hàng nào đang ở đâu, và cần chuyển đi đâu.
Trong bán hàng, các nhà bán lẻ có thể sử dụng dữ liệu để quyết định hàng hóa nên được trưng bày ở đâu, cửa hàng nào bán tốt nhất loại sản phẩm cụ thể nào và theo dõi lối di chuyển của khách quanh cửa hàng. Thẻ khách hàng thân thiết không còn mới lạ, nhưng các phân tích phức tạp hơn về sở thích của khách hàng sẽ giúp nhà bán lẻ có thể dự đoán tốt hơn những gì bạn sẽ mua. Thậm chí, chúng còn phát triển đến mức Amazon tin rằng họ sẽ sớm có thể dự đoán chính xác bạn sẽ mua món gì, đủ để gửi nó đến cho bạn trước cả khi bạn đặt hàng!
Khả năng kết nối cũng đang thay đổi công việc kinh doanh. Năm 2014, Cisco công bố một quỹ 150 triệu đô-la dành cho các công ty khởi nghiệp đang nỗ lực cải thiện sự hợp nhất giữa thế giới thực và thế giới ảo. Đối với một doanh nghiệp, khả năng liên kết mọi khâu
sản xuất, kiểm soát hàng tồn, phân phối và hệ thống an ninh, cũng như liên lạc giữa các khâu với nhau, sẽ mang lại cho họ hiệu suất cao hơn và tiết kiệm hơn. GE (General Electric) gọi sự hội tụ của dữ liệu và máy móc này là một cuộc cách mạng “Internet trong Công nghiệp”, và khẳng định nó sẽ tiết kiệm cho ngành công nghiệp toàn cầu đến 150 tỉ bảng Anh.
Mọi lĩnh vực công nghiệp đều đang học cách gặt hái những lợi ích từ việc phân tích Dữ Liệu Lớn, và dường như chắc chắn việc tìm ra các phương pháp đổi mới nhằm thu thập, ghi chép và phân tích dữ liệu sẽ đóng vai trò lớn trong doanh nghiệp ở tương lai gần.
Thậm chí, ngay cả một lĩnh vực chủ quan và “con người” như Nhân sự cũng đang được Dữ Liệu Lớn và các phân tích làm biến đổi. Tìm kiếm và giữ chân đúng người là vấn đề trăn trở chính ở hầu hết các
doanh nghiệp. Công tác quản trị nhân tài vốn đầy thách thức và cái giá phải trả khi thất bại trong việc quản lý, lãnh đạo là rất lớn. Theo ước tính, việc điều hành thất bại đang gây nên thiệt hại trung bình
2,7 tỉ đô-la9. Các con số ước tính được công bố về mức độ lãnh đạo kém dao động từ 33%10 đến 67%11. Nói cách khác, có khoảng 1/3 cho đến 2/3 lãnh đạo sẽ thất bại trong vai trò của họ.
Nhưng thiệt hại không chỉ về mặt tài chính. Chỉ riêng những cuộc họp điều hành thất bại đã tiềm ẩn nhiều thiệt hại nghiêm trọng, bao gồm các cơ hội bị bỏ lỡ, quan hệ công chúng yếu kém, hủy hoại thương hiệu, năng suất kém cũng như bị nhân viên bỏ rơi, xa lánh. Tác động của việc lãnh đạo kém đến tinh thần nhân viên có thể rất xấu: 40% người lao động Mỹ cho rằng công việc của họ rất áp lực; và 75% người đi làm cho biết yếu tố gây áp lực lớn nhất chính là cấp trên trực tiếp của họ12.
Chọn sai người cho bất kỳ công việc nào cũng có thể là một thảm họa. Và chọn sai giám đốc hay lãnh đạo thì sẽ càng thảm khốc.
Theo như các số liệu khẳng định, nếu cho rằng nhân viên là tài sản lớn nhất của doanh nghiệp và có thể cũng là trách nhiệm lớn nhất,
thì dễ thấy rằng các doanh nghiệp đang ngày càng hào hứng với các giải pháp Dữ liệu Lớn, như Evolv là một ví dụ.
Evolv là một công cụ phần mềm giúp đánh giá và tìm hiểu nhân viên, ứng viên bằng cách tính toán nửa tỉ điểm dữ liệu xuyên suốt 18 ngành nghề, tại 13 quốc gia khác nhau về mọi yếu tố, từ giá xăng, tỷ lệ thất nghiệp và việc sử dụng phương tiện truyền thông xã hội, cho đến khoảng thời gian một người dành ra để đi đến chỗ làm hoặc mức độ thường xuyên mà họ trao đổi với quản lý. Mặc dù các phương pháp thu thập dữ liệu bao gồm cả “huy hiệu thông minh” gây nhiều tranh cãi – giúp giám sát chuyển động của nhân viên và theo dõi họ tiếp xúc lẫn nhau – nhưng các khách hàng của Evolv, chẳng hạn Ngân hàng Mỹ, vẫn hết sức ấn tượng.
Theo báo cáo, Ngân hàng Mỹ đã cải thiện các chỉ số hiệu suất thêm 23% và giảm mức độ căng thẳng (đo lường thông qua việc phân tích giọng nói của nhân viên) xuống 19%, đơn giản chỉ bằng cách cho phép nhiều nhân viên của họ nghỉ giải lao cùng nhau13.
Phần mềm này được sử dụng để dự đoán hàng loạt yếu tố, bao gồm cả khoảng thời gian một nhân viên có khả năng duy trì công việc của họ. Evolv cũng thu thập được một số thông tin ấn tượng
không ngờ đến, như việc trong một số ngành nghề, chẳng hạn như tổng đài viên, sẽ đạt thành tích cao hơn nếu họ từng có tiền án tiền sự. Hoặc các nhân viên từng đổi trình duyệt mặc định trên máy tính sang trình duyệt tùy chọn như Firefox hay Chrome sẽ đạt hiệu suất
cao hơn những ai vẫn sử dụng trình duyệt mặc định như Internet Explorer hoặc Safari14. (Tất nhiên, giờ đây đó là kiến thức công khai, ai cũng biết rằng mọi người có thể “chơi chiêu” bằng cách thay đổi trình duyệt mặc định của họ khi được phỏng vấn, từ đó vô hiệu hóa tiêu chí dự báo này.)
Tuy kiểu phân tích Dữ Liệu Lớn này hiện đang tập trung vào những vai trò phải đối diện với khách hàng, nhưng việc nó vươn đến các cấp bậc quản lý cao hơn chỉ là vấn đề thời gian. Chắc chắn, việc cải thiện thành tích của các giám đốc cấp cao sẽ có “tác động không gì sánh được đối với công ty”, nên các giải pháp Dữ Liệu Lớn chắc
chắn sẽ được cân nhắc. Theo Cơ quan nghiên cứu kinh tế toàn cầu (EIU), hơn nửa bộ phận Nhân sự đã báo cáo về sự gia tăng của các phân tích dữ liệu kể từ năm 2010.
ĐỪNG HOANG MANG!
Tất nhiên, thách thức chính là khi các nhà lãnh đạo doanh nghiệp đọc được những câu chuyện như trên hay nghe về những điều thú vị – và có đôi chút đáng sợ – mà các chuyên gia Dữ Liệu Lớn như Google, Amazon và Facebook đang thực hiện, họ sẽ hoang mang!
Hầu hết các nhà lãnh đạo doanh nghiệp đều biết về Dữ Liệu Lớn vì họ từng sống trong cảnh thiếu giải pháp rồi. Họ hiểu được triển vọng vốn có của nó và thậm chí có thể ý thức được một cách đầy đủ rằng doanh nghiệp của họ rất giàu dữ liệu. Nhưng đa phần các nhà lãnh đạo doanh nghiệp lại không biết làm gì với nó! Chúng ta đã được thông báo suốt hàng năm trời rằng mình đang sống trong Kỷ nguyên Thông tin; chúng ta được nhắc nhở về tầm quan trọng của thông tin, kiến thức và vai trò của lao động tri thức. Chúng ta biết rằng mình cần phải tìm cách truy cập và sử dụng những thông tin đã có và kiểm soát sự bùng nổ thông tin có thể xảy ra, để từ đó tiến đến tương lai. Thông tin đang tích lũy đà và nhịp phát triển. Nó tăng trưởng theo cấp số nhân, thế nhưng, nghiên cứu của chúng ta lại cho thấy rằng có chưa đến 20% lượng dữ liệu mà các doanh nghiệp đang nắm giữ được sử dụng để đưa ra quyết định. Và 20% này cũng chỉ tính đến các dữ liệu KPI hay tài chính theo cấu trúc truyền thống. Nếu dữ liệu có cấu trúc khá dễ trích xuất, thì sự hiểu biết từ dữ liệu phi cấu trúc lại đại diện cho một mạch thông tin quý giá chưa được khai thác và hầu như bị bỏ qua.
Tất nhiên, sự leo thang của dữ liệu và triển vọng vô tận của thông tin cũng có những vấn đề của riêng chúng. Nếu chúng ta đang chết ngập trong dữ liệu không dùng đến, vậy còn điều gì trên thế giới này mà chúng ta định làm với phần còn lại?
Một số kẻ đứng ngoài cuộc đang cảm thấy áp lực của việc không hành động tăng lên, cùng với mọi bài báo mà họ đọc được về cuộc cách mạng Dữ Liệu Lớn. Những nhà lãnh đạo doanh nghiệp dũng
cảm (hoặc điên rồ) quyết định tiến vào và làm rõ xem họ có thể tiếp cận thông tin gì và sử dụng như thế nào; nhưng hiển nhiên, họ sẽ hoàn toàn lạc lối và chết chìm trong thông tin của chính mình, do không thể chuyển đổi chúng thành sự hiểu biết có ý nghĩa. Không may là trong trường hợp này, kết quả của việc hành động và không hành động là như nhau – hoang mang và hỗn loạn!
Cuốn sách này được viết để giúp bạn thay đổi kết điều đó. TẬP TRUNG GẶT HÁI THÀNH QUẢ
Dữ Liệu Lớn mang đến cho doanh nghiệp một cơ hội không gì sánh bằng để biến sự hiểu biết của họ thành hành vi của khách hàng, từ đó biến chúng thành kết quả kinh doanh. NHƯNG chỉ vì chúng ta có
thể đo lường, theo dõi và truy cập vào mọi thứ, không có nghĩa là chúng ta nên làm vậy. Ta rất dễ bị sự bành trướng của công nghệ thông minh đánh lừa, và có vô số khả năng doanh nghiệp sẽ dùng đến cạn kiệt tài nguyên mà chẳng thu được thành quả có ý nghĩa
hay hữu ích nào. Do đó, điều nguy hiểm là chúng ta sẽ bị lạc lối trong biển dữ liệu mà chẳng đem lại giá trị gì.
Vậy nên một mặt, Dữ Liệu Lớn đang thay đổi thế giới vì chúng ta hiện có quá nhiều dữ liệu và định dạng dữ liệu mới. Nhưng mặt khác, vẫn chưa có thay đổi gì nhiều vì chúng ta vẫn đang tìm cách sử dụng dữ liệu và thông tin để thông báo cho doanh nghiệp về quá trình ra quyết định. Điểm khác biệt thực sự duy nhất là hiện nay chúng ta đã có các định đạng dữ liệu mới để sử dụng, cùng với đó là công nghệ mới để thực sự phân tích và tác động đến dữ liệu.
Là những nhà lãnh đạo doanh nghiệp, chúng ta cần hiểu rằng việc thiếu dữ liệu không phải là vấn đề. Hầu hết các doanh nghiệp đều có quá đủ dữ liệu để sử dụng một cách mang tính xây dựng; chúng ta chỉ không biết cách sử dụng chúng. Sự thật là đa số doanh nghiệp đều phong phú về dữ liệu, nhưng nghèo nàn về sự hiểu biết. Có thể các công ty như Amazon, Google và Facebook được hưởng lợi thế cạnh tranh đáng kể là vì lượng dữ liệu mà họ có quyền truy cập, nhưng họ cũng có ngân sách lớn cùng các nhóm khoa học dữ liệu chỉ có một nhiệm vụ duy nhất là phân tích dữ liệu. Đối với hầu
hết các doanh nghiệp, điều này là bất khả thi, phi thực tế hoặc không cần thiết. Ngay lúc này, có thể bạn đã có thừa dữ liệu để chạm đến sức mạnh của Dữ Liệu Lớn mà không cần đến công nghệ đỉnh cao hay ngân sách nhiều đến lóa mắt. Và ngay cả khi doanh nghiệp của bạn lưu giữ không thực sự tốt hoặc không nắm giữ một lượng dữ liệu khổng lồ sẵn có, thì chắc chắn vẫn có đủ các nguồn dữ liệu bên ngoài để bạn sử dụng sức mạnh của Dữ Liệu Lớn trong kinh doanh.
Như vậy, về cơ bản, điều quan trọng không phải là bạn đã truy cập được một lượng thông tin khó dò được hay hệ thống thu thập dữ liệu của bạn đến nay vẫn còn thô sơ. Dữ Liệu Lớn có thể cách mạng hóa doanh nghiệp của bạn – nhưng chỉ khi chúng ta tập trung vào Dữ Liệu THÔNG MINH (SMART), chứ không phải Dữ Liệu Lớn. Để làm được điều đó, chúng ta cần một bộ khung thực tiễn, có thể giúp ta chiến đấu chống lại con quái vật Dữ Liệu Lớn, để từ đó chúng ta có thể sử dụng nó để thu thập những hiểu biết mới sẽ dẫn đường cho doanh nghiệp trong tương lai.
Chúng ta cần có cách để vượt qua đại dương dữ liệu, để tìm kiếm một chút ý nghĩa. Giống như các ngư dân hiện đại, chúng ta – cần một cách phức tạp nhưng thực tiễn – để nhận ra mình đang cố gắng chiếm lấy những khách hàng nào, nhận ra những điều mình cần biết để phân bổ những khách hàng đó, dự đoán hành vi của họ và đem lại kết quả lợi nhuận sau cùng.
Cuốn sách này cung cấp hệ thống định hướng cần thiết (xem hình 1.1), cho phép bạn tạo nên một doanh nghiệp THÔNG MINH (SMART) và sử dụng sức mạnh tuyệt vời đó của Dữ Liệu Lớn, bất kể quy mô và ngân sách của bạn như thế nào.
Hình 1.1. Mô hình SMART
Mô hình SMART được mô phỏng theo kết cấu của cuốn sách này. Mỗi chương sẽ mở ra từng phần của mô hình và cung cấp một cấu
trúc thực tiễn mà bạn có thể sử dụng để tận dụng lợi thế của Dữ Liệu Lớn trong kinh doanh.
Do đó, để đi xuyên qua sự hỗn loạn, hoang mang và lèo lái một khối dữ liệu có thể hoặc đang tồn tại, chúng ta phải “Khởi đầu với chiến lược” (Start with strategy). Thay vì bắt đầu với dữ liệu, hãy bắt đầu với các mục tiêu kinh doanh và những gì bạn đặc biệt cố gắng để đạt được. Điều này sẽ tự động hướng bạn đến các câu hỏi cần trả lời, từ đó lập tức thu hẹp những nhu cầu dữ liệu thành các lĩnh vực có thể kiểm soát được.
Một khi đã biết mình đang cố gắng đạt được điều gì, bạn sẽ cần tìm hiểu xem mình có thể tiếp cận thông tin bằng cách nào, để “Đo lường các chỉ số và dữ liệu” (Measure metrics and data). Khi đã biết loại dữ liệu nào có sẵn và tiếp cận được, bạn sẽ cần “Áp dụng phương pháp phân tích” (Apply analytics) để đúc kết những hiểu biết hữu ích từ dữ liệu đó, từ đó có thể trả lời các câu hỏi chiến lược. Tất nhiên, chỉ hiểu biết thôi thì vô ích, trừ khi bạn “Báo cáo kết quả” (Report result). Đây là ba giai đoạn của doanh nghiệp THÔNG MINH (SMART) được công nghệ trợ giúp. Công nghệ sẽ giúp bạn thu thập dữ liệu cần thiết để đo lường, khiến các phân tích trở nên dễ dàng theo các cách mà có lẽ bạn chưa từng nghĩ đến, đồng thời cho phép bạn chuyển đổi hiểu biết thành những dữ liệu được hình ảnh hóa dễ hiểu hơn, và nhanh chóng thúc đẩy hành động từ đó.
Khi tiếp cận dữ liệu (dù lớn hay nhỏ) và các phân tích từ một góc nhìn hẹp hơn, nhưng tập trung và thực tiễn hơn, bạn có thể phá tan áp lực và hoang mang xung quanh Dữ Liệu Lớn, gặt hái những thành quả đáng kể và “Biến đổi doanh nghiệp của mình” (Transform your business).
CHÚ THÍCH
5. SAS Whitepaper (2012) Big Data Meets Big Data Analytics: Three Key Technologies for Extracting Real-Time Business Value from the Big Data That Threatens to Overwhelm Traditional Computing Architectures (tạm dịch: Dữ Liệu Lớn kết hợp Phân tích Dữ Liệu
Lớn: Ba công nghệ then chốt giúp đúc kết giá trị thực của doanh nghiệp từ Dữ Liệu Lớn, từ đó đe dọa chôn vùi những kiến trúc máy tính truyền thống).
6. Mayer-Schonberger, V. và Cukier, K. (2013) Big Data: A Revolution That Will Transform How We Live, Work and Think (tạm dịch: Dữ Liệu Lớn: Cuộc cách mạng sẽ thay đổi cách chúng ta sống, làm việc và suy nghĩ). London: NXB John Murray.
7. Viết tắt của Food and Drug Administration – Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ.
8. Amazon S3: Amazon Simple Storage Service – dịch vụ đám mây lưu trữ có thể tải lên các tệp, các tài liệu, các dữ liệu tải về của người dùng hoặc bản sao lưu.
9. Smart, B. D. (1999) Topgrading (tạm dịch: Đầu bảng). Upper Saddle River, NJ: Prentice-Hall.
10. Sorcher, M. (1985) Predicting Executives Success (tạm dịch: Dự báo thành công của các giám đốc). New York: Wiley.
11. Hogan, R. và Hogan, J. (2001) Assessing leadership: A view of the dark side (tạm dịch: Đánh giá lãnh đạo: Nhìn từ mặt xấu). Tạp chí Chọn lọc và Đánh giá Quốc tế, tập 9, trang 40-51.
12. Off the Rails: Avoiding the High Cost of Failed Leadership (tạm dịch: Trật đường ray: Tránh tổn thất lớn cho lãnh đạo kém).
13. Kuchler, H. (2014) “Data pioneers watching us work (tạm dịch: Những nhà tiên phong dữ liệu đang quan sát chúng ta làm việc)”. Financial Times. http://www.ft.com/cms/s/2/d55004b0-9581-11e3- 9fd6-00144feab7de.html#axzz2tdOLCswb.
14. Javers, E. (2014) Inside the wacky world of weird data (tạm dịch: Bên trong thế giới lập dị của dữ liệu khác thường: Con số nào đang được tính toán). CNBC. http://www.cnbc.com/id/101410448.
2S = Start with strategy - Khởi đầu với chiến lược
Đ
ể kinh doanh thông minh hơn, hãy khởi đầu với chiến lược. Và điều đó luôn đúng, bất kể bạn là một gã khổng lồ Dữ Liệu Lớn như Amazon, Google hay chỉ là một cửa hàng gia đình nhỏ nơi góc phố.
Chúng ta rất dễ lạc lối và bị nhấn chìm trong khoa học về dữ liệu và phân tích. Điều đó đã xảy ra trước thời Dữ Liệu Lớn và gia tăng gấp bội vào thời nay. Các nhà lãnh đạo doanh nghiệp trên khắp thế giới đang hoang mang. Họ đọc được rằng những gã khổng lồ Dữ Liệu Lớn chẳng bao giờ ném đi bất kỳ dữ liệu nào, rằng các doanh nghiệp giàu dữ liệu này nắm bắt, phân tích mọi thứ như thế nào, vì chúng rất giá trị và có khả năng mang đến những hiểu biết độc nhất và đầy sức mạnh cho công cuộc phát triển doanh nghiệp. Ngay cả những chỗ sai sót cũng không bị loại bỏ… Hãy gõ những cái tên sai chính tả và nhấp lệnh tìm kiếm – chắc hẳn các dữ liệu này có thể bị xóa bỏ, nhưng với Google thì không. Thay vì bỏ qua, họ đã dùng chúng để tạo nên bộ kiểm tra chính tả tốt nhất thế giới15.
Với hầu hết các nhà lãnh đạo doanh nghiệp, ý tưởng thu thập và lưu trữ mọi thứ thực sự đáng sợ. Không chỉ vì họ đã có cả núi tài liệu lưu trữ trong các tập hồ sơ đóng bụi dưới tầng hầm, mà còn vì họ chẳng thèm xử lý các tài liệu mới phát sinh thêm mỗi ngày! Thậm chí đến việc suy ngẫm về những vấn đề mà một doanh nghiệp có thể phải đối mặt trong thế giới Dữ Liệu Lớn cũng đã mệt mỏi và đầy áp lực… Điều gì cấu thành mọi thứ, nên dùng kiểu định dạng nào, chúng sẽ được lưu trữ ở đâu và như thế nào, ai sẽ sử dụng chúng, ai sẽ sở hữu chúng, chúng ta sẽ chi trả cho chúng như thế nào, sẽ làm gì với chúng, và sẽ bắt đầu từ đâu?
Đối với những gã khổng lồ Dữ Liệu Lớn như Tesco, Walmart hay Amazon, vấn đề là mọi mẩu dữ liệu nhỏ đều có thể vô cùng đáng giá ở mức độ nào đó. Nhưng đó là vì các doanh nghiệp này có chuyên môn phân tích, tiền bạc và khả năng công nghệ để đầu tư đầy đủ vào khả năng lưu trữ và khai thác lượng dữ liệu phong phú này để mang lại sự thấu hiểu. Thêm vào đó, họ cũng thuộc hàng tân tiến trong thế giới mới này, vì vậy thường thu hút những nhân tài kiệt xuất nhất.
Nhưng theo phỏng đoán, có đến 99,9% các công ty trên thế giới sẽ không bao giờ đạt đến vị thế đó. Đến nay, phần lớn các doanh nghiệp sẽ không bao giờ có đủ thời gian, tiền bạc, chuyên môn và/hoặc ý định nghiền ngẫm dữ liệu theo cách mà các tập đoàn khổng lồ vẫn làm. Nhưng điều đó không có nghĩa rằng bạn có thể bỏ qua Dữ Liệu Lớn.
Hình 2.1. Mọi con đường đều dẫn đến Khởi đầu với chiến lược
Bên cạnh đó, vẫn có một lượng Dữ Liệu Lớn khổng lồ chưa từng sẵn có trước đây mà các doanh nghiệp nhỏ hơn có thể sử dụng. Chẳng hạn, nếu điều hành một tiệm tạp hóa nhỏ, giờ bạn có thể tải về dữ liệu thời tiết từ dịch vụ Met Office và dùng nó để dự đoán xem bạn nên dự trữ mặt hàng nào. Do đó, ngay cả những công ty nhỏ cũng có thể chạm vào Dữ Liệu Lớn và tận dụng nó để cải thiện những sản phẩm của họ.
Tin rất vui là những thông tin mà bạn hiện có thể hoặc không thể truy cập thực sự không phải là vấn đề. Hình 2.1 chính là bằng chứng. Ngay từ đầu, việc doanh nghiệp của bạn có hàng khối dữ liệu sẵn sàng được phân tích hay không có dữ liệu nào quả thực chẳng hề quan trọng. Điều đó không thể thay đổi giá trị của việc bắt đầu với chiến lược.
Ngoại lệ duy nhất của nguyên tắc này là khi bạn đã có sẵn một lượng lớn dữ liệu số hóa trong tay. Trong trường hợp này, sẽ là hợp
lý nếu bạn phân bổ một phần ngân sách và tài nguyên cho việc khám phá dữ liệu.
Nếu doanh nghiệp đã truy cập vào một lượng lớn dữ liệu có thể được khai thác và phân tích, thì chắc chắn họ nên dành 10% nỗ lực phân tích cho việc khám phá dữ liệu. Khi bắt đầu với chiến lược, bạn phải tìm ra điều mình cần biết, cũng như dữ liệu nào bạn cần thu thập để tìm thấy câu trả lời. Trong quá trình khám phá dữ liệu, bạn chỉ cần quan sát dữ liệu mà không cần đưa ra bất kỳ câu hỏi hay kế hoạch nào, để xem những gì mà dữ liệu nói về doanh nghiệp của bạn. Quá trình khám phá dữ liệu này có thể là một sự bổ sung hữu dụng cho phương thức tiếp cận phù hợp hơn được vạch ra trong cuốn sách này, cũng như có khả năng tận dụng hết vốn quý của dữ liệu.
Ví dụ, Facebook đã quan sát toàn bộ dữ liệu họ có thông qua hàng triệu dòng cập nhật trạng thái và có thể giải mã một hành vi xung quanh các mối quan hệ từ sự hỗn loạn đó. Đến mức Facebook có thể dự đoán khi nào bạn sẽ thay đổi trạng thái từ “Độc thân (Single)” sang “Trong một mối quan hệ (In a relationship)” và ngược lại. Hiện tại, đó chỉ là một sự thấu hiểu kỳ quặc, nhưng sẽ đến lúc Facebook có thể cấp phép cho các công ty khác sử dụng dữ liệu đó – những công ty chuyên sản xuất các sản phẩm đặc biệt hữu ích cho những người mới bắt đầu một mối quan hệ (các gói du lịch dành cho cặp đôi) hoặc mới chia tay (khăn giấy và kem Ben & Jerry!). Facebook đầu tư vào khám phá dữ liệu vì họ có thể – họ có khối lượng dữ liệu khổng lồ để biến nó trở nên đáng giá, không kể thời gian, năng lực, công nghệ hay tiền bạc; nhưng đây chắc chắn không phải là xuất phát điểm cho hầu hết các doanh nghiệp.
Trong tương lai, những kiểu khám phá dữ liệu trên chắc chắn có thể cách mạng hóa doanh nghiệp và thậm chí có thể thay đổi mô hình kinh doanh của bạn. Nhưng chúng vẫn chỉ luôn là một phần bổ sung của phương thức tiếp cận kinh doanh SMART, chứ không thể thay thế nó.
TRONG THẾ GIỚI DỮ LIỆU LỚN, NHỎ LÀ ĐẸP
Để gặt hái những lợi ích của Dữ Liệu Lớn, bạn không cần phải thu thập mọi thứ và tạo ra một cơ sở dữ liệu lớn nhất, phức tạp nhất thế giới. Như tôi sẽ giải thích trong chương này, mục đích của bạn thực ra là ngược lại – hiểu thật rõ bạn cần dữ liệu gì, có thể và sẽ dùng dữ liệu nào để xây dựng một cơ sở dữ liệu nhỏ nhất, nhưng rõ ràng nhất thế giới!
Hãy nghĩ về dữ liệu như những vật dụng và tài sản trong nhà. Nếu bạn đã sống trong một ngôi nhà hơn năm năm, nhiều khả năng bạn sẽ tích lũy đồ đạc – bạn thậm chí còn không nhớ rằng mình có một số món, cho đến khi mở cửa kho và bị chúng rơi trúng đầu. Ngay cả khi quyết định dọn dẹp, đó cũng có thể là cơn ác mộng vì chúng ta sẽ nghĩ: “Ừm, tốt hơn là mình không nên vứt thứ đó đi vì nó có thể sẽ cần thiết trong tương lai.” Chẳng hạn, tôi có một người bạn chuyên nhặt nhạnh cả một lô khuôn bánh thủy tinh nhỏ từ các món tráng miệng mua về như kem nướng. Chồng cô ấy cố gắng vứt chúng đi, nhưng cô ấy cứ giữ lại vì biết đâu chúng sẽ có ích. Đôi khi đúng là thế, nhưng đâu cần đến 20 chiếc như vậy!
Nếu bạn sống trong nhà mình suốt 20 năm, đống đồ đạc tích trữ từ các món hàng dại dột mua, quần áo thừa, quà tặng không hợp hay quần áo cũ có thể vùi lấp bạn. Thậm chí có cả chương trình truyền hình về những kẻ cuồng tích trữ quá nhiều đồ đạc (đa phần là đồ bỏ
đi) mà họ không thể tìm chỗ để trong nhà được nữa! Lượng đồ đạc mà chúng ta tích trữ thường chỉ “hiện ra” khi chúng ta quyết định chuyển nhà hoặc bỏ bớt đồ. Thách thức này dường như bất khả thi. Thông thường, chỉ khi nào hạ quyết tâm leo lên gác xép để nhìn vào đống đồ đạc, chúng ta mới nhận ra chúng tất thảy đều đã quá hạn và lỗi thời.
Điều tương tự cũng đúng với dữ liệu. Đa phần, dữ liệu luôn có một “quãng đời”. Điều này thực sự rất quan trọng bởi Dữ Liệu Lớn quả thực đang tạo thêm áp lức cho các doanh nghiệp phải chịu sức ép về việc họ cần làm với dữ liệu của mình; và sức ép này cứ tăng dần
theo từng năm, khi họ tự nhận thấy mình đang dần bị chôn vùi dưới hàng khối dữ liệu ngày càng tăng. Điều này thực sự không đúng, vì đối với hầu hết các doanh nghiệp, dữ liệu khách hàng đã có trên
năm năm dẫu sao cũng không quá hữu dụng. Nguyên nhân khiến những gã khổng lồ Dữ Liệu Lớn tận dụng hiệu quả Dữ Liệu Lớn là vì họ có thể truy cập vào hàng khối dữ liệu khách hàng khổng lồ hiện tại, giúp họ mô tả sơ lược về khách hàng và cải thiện hiệu suất. Đối với những gã khổng lồ dữ liệu có đủ công nghệ và năng lực để rà soát dữ liệu cũ hơn, họ có thể rút ra một số hiểu biết thú vị hay xu hướng mua hàng, nhưng chúng lại không thích hợp với hầu hết các doanh nghiệp. Hãy cứ xem đó như một tham vọng “nên có” cho tương lai, chứ không phải một mục tiêu sứ mệnh then chốt trong hiện tại.
Như vậy, thay vì để quá trình tích lũy dữ liệu không ngừng này làm tăng thêm áp lực cho bạn, hãy quên những dữ liệu cũ đã có hơn năm năm và quan trọng hơn là dừng lại và tự hỏi xem dữ liệu nào thực sự quan trọng nhất. Rồi sử dụng sự thấu hiểu đó để định hướng hành động cũng như yêu cầu dữ liệu của bạn.
Bắt đầu với chiến lược cho phép bạn phát triển những chiến lược giúp mình nhận diện các dữ liệu mà bạn thực sự cần đến; thông thường, điều này cũng có nghĩa là một sự kết hợp giữa các dữ liệu “nhỏ” truyền thống hay dữ liệu sẵn có với các định dạng dữ liệu mới, cũng như dữ liệu mới di chuyển nhanh hơn và Dữ Liệu Lớn.
Chẳng hạn, các nhà nghiên cứu tại Đại học Harvard và Northeastern đã chứng minh rằng dự án Google Flu Trends của năm 2009 đã ước tính số lượng ca bệnh quá cao sau bốn năm tiến hành. Dự án này nhằm xác định các cơn bùng phát dịch cúm từ các truy vấn tìm kiếm trên Google dựa theo Dữ Liệu Lớn. Và xét cho cùng, cũng hợp lý khi điều hầu hết mọi người thường làm khi bắt đầu cảm thấy khó ở trong người… đó là tra Google! Họ thường sẽ tìm hiểu về các triệu chứng trước khi đặt hẹn với bác sĩ. Đa phần, mọi người chỉ Google từ “Cúm” (Flu) khi họ cảm thấy không khỏe hoặc người họ yêu thương cảm thấy không khỏe. Điều này không nói lên rằng tất cả những ai cảm thấy không khỏe và Google từ “cúm” đều nhiễm cúm, nên con số ước tính quá cao chẳng có gì bất ngờ. Nhiều người đã tìm cách hạ thấp sự xác đáng của Dữ Liệu Lớn thông qua các ví dụ như trên. Thế nhưng, thậm chí các nhà
nghiên cứu nhận ra ước tính thái quá cũng thừa nhận rằng việc kết hợp Google Flu Trends dựa trên Dữ Liệu Lớn với dữ liệu truyền thống từ Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh 16 đã cải thiện dự báo tổng thể.
Bản thân Dữ Liệu Lớn không thể sai được, nhưng khi sử dụng và kết hợp nó với nguồn dữ liệu sẵn có một cách có chiến lược, nó có thể mang lại một số hiểu biết cực kỳ hữu dụng.
Nếu bạn muốn sử dụng Dữ Liệu Lớn để cải thiện việc kinh doanh và giành lấy lợi thế cạnh tranh, bạn cần hiểu rõ các mục tiêu chiến lược lớn của mình là gì. Một khi đã xác định được chúng, bạn cần lọc ra những câu hỏi lớn mà bạn muốn tìm đáp án, để từ đó có thể tìm ra dữ liệu nào – dù lớn hay nhỏ – sẽ cho bạn đáp án. Như vậy, việc bắt đầu với chiến lược sẽ cho phép bạn nhận diện các nhu cầu thông tin chiến lược thông qua việc sử dụng bảng chiến lược SMART.
Bảng chiến lược SMART
Nhằm giúp các công ty thực sự hiểu rõ nhu cầu dữ liệu của họ, tôi đã thiết kế bảng dữ liệu SMART (xem hình 2.2). Bảng mẫu này đã giúp rất nhiều khách hàng của tôi điều khiển những con sóng dữ liệu lớn (và nhỏ) để thu hoạch thành quả mà không phải chịu áp lực.
Hình 2.2. Bảng chiến lược SMART
Mục đích của bảng chiến lược SMART là giúp bạn dừng lại và tự hỏi xem những nhu cầu thông tin chiến lược của mình là gì. Bạn không thể nhận diện những nhu cầu này nếu không hiểu rõ chiến
lược của mình. Hãy nhớ rằng giá trị của dữ liệu không phải là bản thân dữ liệu – mà là những gì bạn làm với dữ liệu đó. Để có được dữ liệu hữu ích, trước tiên, bạn cần phải biết mình cần dữ liệu gì. Nếu không, bạn sẽ bị thôi thúc tìm hiểu tất cả và đó không phải là chiến lược. Đó chỉ là hành động của sự tuyệt vọng dẫn đến cái kết
là một thất bại thê thảm. Tại sao phải dành hết thời gian và tự sa vào rắc rối khi thu thập các dữ liệu mà bạn sẽ không, hoặc không
thể sử dụng nhằm đem lại sự hiểu biết kinh doanh? Bạn phải tập trung vào những điều quan trọng nhất, nếu không, bạn sẽ chết chìm trong dữ liệu. Dữ liệu là tài sản chiến lược, nhưng chúng chỉ có giá trị nếu được sử dụng một cách mang tính xây dựng và phù hợp để mang lại kết quả.
Đó là lý do tại sao khởi đầu với chiến lược là điều rất quan trọng. Nếu hiểu rõ những gì bạn đang cố gắng đạt được, bạn sẽ có thể nghĩ đến các câu hỏi SMART mà bạn cần câu trả lời. Chẳng hạn, nếu chiến lược của bạn là gia tăng nguồn khách hàng, thì các câu
hỏi SMART mà bạn cần trả lời sẽ bao gồm: “Khách hàng hiện tại của chúng ta là ai?”, “Đặc điểm nhân khẩu học của những khách hàng giá trị nhất của chúng ta là gì?” và “Đâu là giá trị vòng đời của khách hàng?” Khi đã biết những câu hỏi mà mình cần trả lời, bạn sẽ dễ dàng xác định các dữ liệu cần truy cập hơn để trả lời chúng. Yêu cầu về dữ liệu, chi phí và mức độ áp lực sẽ giảm đáng kể khi bạn chuyển từ “thu thập tất cả để đề phòng” sang “thu thập và đánh giá x, y để trả lời câu hỏi z”. Dữ Liệu Lớn sẽ chuyển từ “bất khả thi” sang “hoàn toàn khả thi” đối với chúng ta.
Ví dụ, tôi từng làm việc với một công ty bán lẻ thời trang nhỏ không có dữ liệu gì ngoại trừ dữ liệu bán hàng truyền thống của họ. Họ muốn gia tăng doanh số, nhưng không đào đâu ra Dữ Liệu SMART để giúp họ đạt được mục tiêu đó. Thế nên, chúng tôi đã cùng nhau vạch ra các câu hỏi SMART mà họ cần trả lời, bao gồm:
• Có bao nhiêu người thực sự đi ngang qua các cửa hàng của chúng ta?
• Có bao nhiêu người dừng lại để ngó vào cửa sổ và trong bao lâu? • Có bao nhiêu người trong số họ bước vào cửa hàng? • Có bao nhiêu người mua hàng?
Chúng tôi muốn lắp đặt một thiết bị nhỏ và kín đáo trên cửa sổ của cửa hàng để theo dõi tín hiệu điện thoại di động khi mọi người đi ngang qua cửa hàng. Chí ít thì tất cả những người đi ngang cửa
hàng đều mang theo điện thoại di động (thứ mà ngày nay ai ai cũng có); bộ cảm biến trong thiết bị sẽ bắt sóng và “đếm”, từ đó trả lời câu hỏi đầu tiên. Bộ cảm biến cũng sẽ tính toán xem có bao nhiêu người dừng lại để nhìn vào cửa sổ và trong bao lâu, cũng như có bao nhiêu người bước vào cửa hàng. Cuối cùng, dữ liệu bán hàng sẽ ghi nhận những ai thực sự mua hàng.
Bằng cách tổng hợp dữ liệu từ các bộ cảm biến ít tốn kém được lắp sẵn trên cửa sổ với dữ liệu giao dịch, chúng tôi có thể tính tỷ lệ chuyển đổi, thử nghiệm quần áo trưng bày bên cửa sổ và nhiều hình thức cung cấp khác để xem phương án nào làm tăng tỷ lệ chuyển đổi. Nhà bán lẻ thời trang này đã không chỉ tăng doanh thu đáng kể – bằng cách kết hợp dữ liệu truyền thống nhỏ với Dữ Liệu Lớn phi truyền thống một cách thông minh – mà còn sử dụng những điều họ biết để tiết kiệm chi phí đáng kể bằng cách đóng một trong số các cửa hàng. Cuối cùng, các bộ cảm biến có thể mách cho họ rằng thông tin bước chân người đi qua do một công ty nghiên cứu thị trường báo cáo trước khi khai trương địa điểm đó là sai lệch, và lượng khách đi ngang qua không đủ để họ quyết định tiếp tục mở cửa hàng.
Phép ẩn dụ cây lê
Bảng chiến lược SMART thực sự khá hợp lý và tuân theo quy luật tự nhiên. Chẳng hạn, nếu quan sát một cây lê, bạn sẽ thấy mục đích của nó là ra quả. Nhưng có rất nhiều hoạt động diễn ra trong cây lê để biến kết quả đó thành khả thi. Doanh nghiệp của bạn cũng vậy. Phần mục đích trong bảng chiến lược SMART của bạn chính là kết quả mong đợi và dễ thấy từ hoạt động kinh doanh, cũng giống như quả lê là “kết quả dễ thấy” của cây lê.
Phần nguồn lực ở cuối bảng đại diện cho các yếu tố ổn định trong doanh nghiệp. Cũng giống như rễ cây, chúng thường khuất khỏi tầm mắt, nhưng lại cung cấp chất dinh dưỡng và các thành phần tạo nên kết quả khả thi. Cũng giống như rễ cây lê hút chất dinh dưỡng và nước từ đất rồi chuyển chúng đến đúng các bộ phận của cây vào đúng thời điểm, các nguồn lực hữu hình và vô hình của doanh nghiệp cũng được chuyển đến đúng nơi để đem lại kết quả. Ở
Ở phần trung tâm, nằm giữa nguồn lực và kết quả là phần khách hàng, tài chính và hoạt động trong bảng chiến lược SMART, đại diện cho phần hoạt động kinh doanh cốt lõi để có thể đem lại kết quả – giống với thân cây lê. Sản phẩm và dịch vụ của bạn không xuất hiện một cách tình cờ hay thần kỳ, và quả lê cũng không tự nhiên xuất hiện trên cây nhờ phép màu. Chúng là kết quả tự nhiên của mạng lưới vô hình và hữu hình của các mối liên kết – giống như sản phẩm hay dịch vụ của bạn. Mỗi phòng ban và bộ phận chính trong các dịch vụ chăm sóc khách hàng, tài chính và hoạt động của bạn đều đại diện cho các nhánh chính của cây lê, đều đóng vai trò cốt yếu trong việc tạo nên sản phẩm cuối cùng. Trong các phòng ban và lĩnh vực đó, bao gồm những năng lực cốt lõi nhằm:
• Phát triển sản phẩm và dịch vụ: Nghiên cứu thị trường, thiết kế và phát triển sản phẩm, dịch vụ mới.
• Tạo nguồn cầu: Phân tích thông tin thị trường, phát triển và quản lý các mối quan hệ khách hàng, theo dõi xu hướng khách hàng, marketing và xây dung thương hiệu;
• Đáp ứng nhu cầu: Tạo nguồn sản phẩm và dịch vụ, sản xuất sản phẩm và dịch vụ, quản lý chuỗi cung ứng, quản lý các quy trình kinh doanh, quản lý mạng lưới phân phối, cung cấp dịch vụ chăm sóc và hỗ trợ;
• Pháp lý và xã hội: Quản lý sức khỏe và an toàn lao động, trách nhiệm xã hội của doanh nghiệp, giảm thiểu tác động đến môi trường.
Các lĩnh vực và năng lực cốt lõi trên sẽ mang sức mạnh đến cho doanh nghiệp của bạn, cũng như kết nối nguồn lực với các bộ phận tạo nên kết quả khả thi – giống như cách thân cây tiếp sức mạnh cho cây và kết nối rễ cây với các nhánh chính, từ đó cho ra quả lê.
Doanh nghiệp của bạn là một thể hoàn toàn phụ thuộc lẫn nhau tạo nên sản phẩm hay dịch vụ của bạn giống hệt như cây lê là một thể phụ thuộc khác tạo ra quả lê. Chỉ có thân cây thì không thể ra quả, và chỉ có nhánh cây hay rễ cây cũng không. Quả lê chỉ xuất hiện khi
rễ kết nối với thân, còn thân kết nối với nhánh. Tương tự, doanh nghiệp của bạn sẽ không tạo ra sản phẩm hay dịch vụ một cách hiệu quả và sinh lời trừ khi rễ, thân và nhánh cây của bạn đều được kết nối với nhau và hợp thành một thể thống nhất. Ngoài ra, mọi người trong doanh nghiệp đều phải biết rõ chiến lược của bạn và làm thế nào mỗi bộ phận trong doanh nghiệp gắn kết với nhau để đóng góp cho các mục tiêu đó.
Vậy nên, để thành công, bạn phải hiểu nhiều thứ, không chỉ sản phẩm và dịch vụ của mình – điều đưa chúng ta đến với phần cạnh tranh và rủi ro. Đây là phần thường bị bỏ quên trong quy trình chiến lược, vốn được xây dựng từ các bản đồ chiến lược hay thẻ điểm cân bằng truyền thống. Tuy nhiên, ai trong doanh nghiệp cũng biết rằng có những rủi ro, thách thức đến từ bên ngoài và ít liên quan đến việc kinh doanh. Quay lại với hình ảnh so sánh cây lê…, phần cạnh tranh và rủi ro giống như thời tiết hoặc dịch bệnh không mong đợi. Cây lê không thể kiểm soát thời tiết, cũng không thể ngăn các cây kế cận bị nhiễm vi-rút, hoặc nhờ một thứ phân bón thần kỳ nào đó mà cho ra những quả lê to và ngon ngọt hơn rất nhiều. Trong kinh doanh, cũng có những rủi ro bên trong và bên ngoài có thể tác động đến mục tiêu cần đạt được, hoặc thời điểm đạt mục tiêu.
Ứng dụng bảng chiến lược SMART VÀO HÀNH ĐỘNG
Thậm chí trước cả khi nghĩ đến các dữ liệu mà bạn có thể hoặc nên thu thập, bạn vẫn cần vạch ra các câu hỏi SMART cần trả lời bằng cách xem xét từng phần khác nhau trong bảng chiến lược SMART. Mỗi phần sẽ cung cấp một kế hoạch chi tiết, cùng với 4-5 câu hỏi SMART. Sau đó, những câu hỏi này sẽ cấu thành nền tảng cho chiến lược phân tích/Dữ Liệu Lớn của bạn. Có cả thảy sáu phần trong bảng chiến lược SMART:
1. Phần Mục tiêu;
2. Phần Khách hàng;
3. Phần Tài chính;
4. Phần Hoạt động;
5. Phần Nguồn lực;
6. Phần Cạnh tranh và Rủi ro.
1. Phần mục tiêu
Phần mục tiêu tạo nên một tầm nhìn và cung cấp một bộ khung đầy cảm hứng hoặc một bối cảnh tổng thể liên quan đến chiến lược doanh nghiệp hay điều mà doanh nghiệp của bạn tìm cách đạt được. Hãy lưu ý rằng các doanh nghiệp thường không đặt ra những câu hỏi SMART cho phần này; vai trò của nó là thiết lập bối cảnh và định hướng tổng thể.
Cách tốt nhất để đạt được điều này là viết ra tuyên bố sứ mệnh và tầm nhìn của bạn một cách chi tiết – trong đó mỗi tuyên bố gắn với một nhiệm vụ khác nhau.
Tuyên bố sứ mệnh của bạn là một tuyên bố mục tiêu rõ ràng, dứt khoát thể hiện lý do vì sao công ty của bạn tồn tại. Tuyên bố sứ mệnh nên truyền đạt ý định của bạn một cách mạnh mẽ, đưa ra lộ trình hành động và ra quyết định khi bạn cố gắng hướng đến mục tiêu hay mục đích chiến lược. Về cơ bản, đó là một tài liệu nội bộ được soạn ra để động viên các cổ đông và xác định các chỉ số chính đối với thành công của doanh nghiệp. Do vậy, nó phải bao gồm khách hàng mục tiêu của bạn, các sản phẩm hay dịch vụ mà bạn cung cấp cho nhóm khách hàng đó, cũng như những điều khiến chúng trở nên độc nhất.
Tuyên bố tầm nhìn của bạn cũng xác định mục đích, nhưng là từ góc nhìn tham vọng hay “thứ” mà bạn muốn doanh nghiệp của mình trở thành trong tương lai. Như một bức tranh truyền cảm hứng về hoài bão của bạn, tuyên bố tầm nhìn cung cấp định hướng cho các cổ đông trong và ngoài doanh nghiệp. Nhân viên trong nội bộ có thể được truyền cảm hứng để cống hiến hết mình nhờ một tuyên bố tầm nhìn mạnh mẽ và ý nghĩa; khách hàng có thể lựa chọn bạn thay vì đối thủ cạnh tranh nhờ tuyên bố tầm nhìn này; và các cổ đông thì
có thể mạnh dạn đầu tư. Tuyên bố tầm nhìn cung cấp định hướng về những điều mà doanh nghiệp xem trọng, từ đó cho biết họ tôn trọng và kỳ vọng những hành vi nào từ các cổ đông.
2. Phần khách hàng
Phần khách hàng nhắc bạn cân nhắc xem hiện tại bạn đã hiểu những khách hàng mà chiến lược của bạn nhắm tới chừng nào, và cần tìm hiểu điều gì để gặt hái mục tiêu chiến lược. Có hai phần mà bạn cần xem xét – thị trường mục tiêu và đề xuất giá trị.
Hãy xem xét chiến lược của bạn (bao gồm sứ mệnh và tầm nhìn). Thị trường mục tiêu của bạn là gì? Bạn có đang dự định thu hút một phân khúc cụ thể – nếu đúng thế thì tại sao và bạn biết gì về phân khúc đó? Bạn có đang nhắm đến một khu vực địa lý nhất định hay một nhóm nhân khẩu học cụ thể? Nếu vậy, bạn cần biết gì về những khách hàng tiềm năng đó để cải thiện khả năng thành công?
Phần thứ hai trong phần khách hàng khuyến khích bạn làm rõ đề xuất giá trị hay điều mà bạn muốn mang đến cho thị trường mục tiêu. Vì sao những khách hàng đó sẽ mua hàng từ bạn? Bạn cho rằng họ sẽ xem trọng chất lượng, giá cả, sự đổi mới, dịch vụ của
bạn hay điều gì khác? Điều gì sẽ góp phần tạo dựng sự hài lòng và trung thành của khách hàng? Bạn có biết không?
Việc nghĩ tới những khách hàng liên quan đến chiến lược của bạn sẽ làm nảy sinh các câu hỏi SMART về khách hàng – hay các câu hỏi mà bạn cần trả lời (xem hình 2.3). Sau đó, các câu hỏi này sẽ làm sáng tỏ loại dữ liệu mà bạn cần thu thập để có câu trả lời.
Hình 2.3. Những câu hỏi SMART về khách hàng: rút ra từ các câu hỏi hiệu suất thiết yếu trong bảng chiến lược SMART
3. Phần tài chính
Phần tài chính nhắc bạn xem xét hiện mình đã hiểu bao nhiêu về các liên can tài chính của chiến lược và điều gì mà bạn vẫn cần tìm hiểu.
Chiến lược của bạn tạo ra tiền như thế nào? Mô hình kinh doanh là gì và bạn có tự tin rằng nó đúng đắn không? Bạn giả định gì về doanh thu, lợi nhuận và đà tăng trưởng của doanh nghiệp khi bạn thực hiện chiến lược? Chi phí để sản xuất và phân phối sản phẩm, dịch vụ là bao nhiêu? Bạn có biết chắc chắn không hay chỉ phán đoán? Hiển nhiên, việc điền đúng thông tin vào phần khách hàng sẽ giúp bạn điền đúng phần tài chính và kéo doanh thu, lợi nhuận và cổ tức cho cổ đông đi lên.
Việc nghĩ tới tình hình tài chính liên quan đến chiến lược của bạn sẽ làm nảy sinh các câu hỏi SMART về tài chính mà bạn cần trả lời (xem hình 2.4). Sau đó, các câu hỏi này sẽ làm sáng tỏ loại dữ liệu mà bạn cần thu thập để có câu trả lời.
Hình 2.4. Những câu hỏi SMART về tài chính: rút ra từ các câu hỏi SMART trong bảng chiến lược SMART
4. Phần hoạt động
Phần hoạt động nhắc bạn xem xét mình thực sự cần làm gì trong phạm vi nội bộ để tiến hành chiến lược và điều gì mà bạn cần tìm hiểu thêm. Cũng giống như phần khách hàng, phần hoạt động gồm hai thành tố – đối tác và năng lực cốt lõi.
Đầu tiên, bạn cần xem xét các nhà cung ứng, nhà phân phối, đối tác và các bên trung gian nào đóng vai trò cốt yếu trong việc tiến hành chiến lược. Bạn hiện có đang làm việc với những người này, hay sẽ cần tạo dựng mối quan hệ với họ? Nếu các mối quan hệ đó đã tồn tại, thì chúng đang tốt đẹp đến đâu?
Bên cạnh đó, bạn cũng cần cân nhắc xem mình cần thể hiện xuất sắc những năng lực cốt lõi nào nếu bạn dự định sẽ thực hiện chiến
lược đã chọn. Có khoảng cách nào không? Nếu có, việc lấp chúng có dễ dàng không? Bạn có biết chắc hay chỉ giả định? Những quy trình nào đang cần hoàn thiện nếu muốn đem lại điều mà thị trường mục tiêu mong muốn?
Một khi đã nắm rõ các yếu tố đơn lẻ được làm nổi bật trong phần khách hàng, tài chính và hoạt động, bạn cần xem xét chúng ảnh hưởng lẫn nhau ra sao. Hãy nhớ rằng khách hàng, tài chính và hoạt động là cốt lõi của doanh nghiệp và chúng cần phải vận hành cùng nhau.
Việc nghĩ tới các hoạt động liên quan đến chiến lược của bạn và cách ăn khớp chúng với mảng khách hàng, tài chính sẽ làm nảy sinh các câu hỏi SMART về hoạt động mà bạn cần trả lời (xem hình 2.5). Sau đó, các câu hỏi này sẽ làm sáng tỏ loại dữ liệu mà bạn cần thu thập để có câu trả lời.
Hình 2.5. Những câu hỏi SMART về hoạt động: rút ra từ các câu hỏi SMART trong bảng chiến lược SMART
5. Phần nguồn lực
Phần nguồn lực nhắc bạn cân nhắc xem mình cần những nguồn lực nào để tiến hành chiến lược của bạn và điều gì mà bạn có thể cần tìm hiểu. Có bốn thành tố trong phần nguồn lực: hệ thống IT và dữ liệu; cơ sở hạ tầng; con người, nhân tài và văn hóa; giá trị và lãnh đạo.
Hình 2.6. Những câu hỏi SMART về nguồn lực: rút ra từ các câu hỏi SMART trong bảng chiến lược SMART
Bạn cần phải xem xét từng thành tố: Bạn sẽ cần hệ thống IT và nguồn dữ liệu nào để tiến hành chiến lược? Bạn sẽ cần cơ sở hạ tầng nào – tài sản, máy móc hay nhà máy? Yêu cầu đối với con
người và nhân tài của bạn là gì? Bạn đã có những người phù hợp chưa; nếu chưa, bạn có thể tìm được họ không? Bạn sẽ cần đào tạo nhân sự hiện tại hay tuyển người mới? Và cuối cùng, các yếu tố văn hóa và lãnh đạo chủ chốt nào sẽ cho phép thực thi chiến lược này?
Việc nghĩ tới các nguồn lực khác nhau mà bạn cần tiếp cận liên quan đến chiến lược của bạn sẽ làm nảy sinh các câu hỏi SMART về nguồn lực mà bạn cần trả lời (xem hình 2.6). Sau đó, các câu hỏi này sẽ làm sáng tỏ loại dữ liệu mà bạn cần thu thập để có câu trả lời.
6. Phần cạnh tranh và rủi ro
Phần cạnh tranh và rủi ro nhắc bạn xem xét bạn sẽ đối đầu với đối thủ cạnh tranh nào khi tìm cách tiến hành chiến lược, cũng như phải đối mặt với những rủi ro nào trên hành trình đó.
Cạnh tranh và rủi ro là phương diện thường bị bỏ qua nhiều nhất trong các sơ đồ chiến lược, dù nó chỉ ra mối đe dọa tiềm ẩn nghiêm trọng đến việc thực thi chiến lược thành công. Hãy xem xét đến những điều bạn đang tìm cách để đạt được, ai là đối thủ chính của bạn và vì sao? Điều gì có khả năng đe dọa thành công của bạn? Có rủi ro nào về một thị trường cụ thể, khách hàng, đối thủ cạnh tranh hay pháp lý có thể làm chệch hướng chiến lược của bạn không? Và các rủi ro về hoạt động, tài chính và nhân tài mà bạn đang đối mặt là gì?
Việc nghĩ tới các đối thủ và rủi ro khác nhau mà bạn có thể đối mặt sẽ làm nảy sinh các câu hỏi SMART về cạnh tranh và rủi ro mà bạn cần trả lời (xem hình 2.7). Sau đó, các câu hỏi này sẽ làm sáng tỏ loại dữ liệu mà bạn cần thu thập để có câu trả lời.
Hình 2.7. Những câu hỏi SMART về cạnh tranh và rủi ro: rút ra từ các câu hỏi SMART trong bảng chiến lược SMART
Câu hỏi thông minh chính là đáp án
Khi xem xét những tranh cãi kịch liệt xung quanh Dữ Liệu Lớn và các phân tích, chúng ta rất dễ bị chúng lấn át và đe dọa. Mỗi khi bạn mở tivi hoặc xem tạp chí quản trị, luôn có một câu chuyện khác viết về một sự thấu hiểu tuyệt vời nào đó có được nhờ Dữ Liệu Lớn. Nhưng thực tế là hầu hết các công ty đều không có đủ tiền bạc, năng lực công nghệ hay nhân tài để liên tục khai thác bộ dữ liệu khổng lồ nhưng hỗn độn này, với hy vọng khám phá ra một “quặng vàng” đáng để đưa tin. Nhưng như thế cũng chẳng sao cả.
Việc tập trung vào các câu hỏi SMART cho phép chúng ta quên đi Dữ Liệu Lớn và tập trung vào Dữ Liệu SMART, từ đó chúng ta sẽ vạch ra chính xác những gì mình cần biết để cải tiến nhờ chúng.
Rất ít doanh nghiệp có thời gian, ý định và nguồn lực để thu thập hàng khối dữ liệu vô tận nhằm trả lời các câu hỏi mà họ không cần đặt ra, hoặc không quan tâm đến đáp án. Điều đó không hề hiệu quả và thực tiễn.
Sự thật là chúng ta rất dễ bị những dữ liệu mình đã lãng quên mê hoặc; nên thực ra chính câu hỏi lại quan trọng hơn đáp án mà dữ liệu có thể, sẽ và nên đưa ra. Và bạn cần biết các câu hỏi nào mà mình cần trả lời trước khi lao vào dữ liệu – dù lớn hay nhỏ đi chăng
nữa.
Các câu hỏi SMART sẽ cho phép bạn tổng hợp chính xác những điều mình cần biết khi xét đến từng mục tiêu chiến lược, do đó bạn có thể tập trung vào những điều sẽ trở nên quan trọng về mặt chiến lược và loại bỏ phần còn lại. Từ đó, các câu hỏi này sẽ giúp bạn nhận diện nhu cầu thông tin, cũng như những Chỉ số (chữ M – Metrics trong SMART) và dữ liệu nào mà bạn cần thu thập để trả lời các câu hỏi SMART của mình.
Các câu hỏi SMART sẽ giúp bạn và đội ngũ điều hành của bạn:
• Nhìn nhận sự việc một cách rõ ràng dựa trên những gì quan trọng và không quan trọng.
• Hiểu được sự xác đáng của dữ liệu thu thập được, vì các câu hỏi SMART sẽ chỉ ra những mối bận tâm lớn nhất của công ty bạn cho tất cả mọi người.
• Cởi mở trong giao tiếp và dẫn dắt thảo luận.
• Đưa ra những quyết định đúng đắn hơn vì có căn cứ.
Đối với mỗi phần (ngoại trừ phần mục đích) trong bảng chiến lược SMART, hãy:
1. Nhận diện một số ít các câu hỏi SMART (thường từ 2-5 câu).
2. Huy động các nhân sự chính từ mỗi “phần” khi đề ra các câu hỏi SMART để tạo điều kiện thuận lợi cho việc trả lời;
3. Làm rõ và ngắn gọn các câu hỏi SMART mỗi khi có thể;
4. Hãy sử dụng các câu hỏi SMART để chúng dẫn đường đến nhu cầu dữ liệu của bạn; từ đó truyền đạt thông tin xác đáng, có ý nghĩa thay vì chết ngộp trong dữ liệu.
CÁC PHƯƠNG PHÁP PHÂN TÍCH SMART VÀ GOOGLE
Các doanh nghiệp thực sự thành công hiện nay đang đưa ra quyết định dựa trên sự kiện thực tế và sự thấu hiểu từ dữ liệu, chứ không theo quan điểm, cảm tính hay thậm chí kinh nghiệm. Bất kể có tiếp
cận được hàng tấn dữ liệu hay không, nếu bạn bắt đầu với chiến lược và nhận biết các câu hỏi SMART cần trả lời để đem lại kết quả, thì bạn sẽ sẵn sàng cải thiện hiệu suất và khai thác sức mạnh chính của dữ liệu.
Hiện nay, mỗi nhà quản lý đều có cơ hội sử dụng dữ liệu để hỗ trợ việc ra quyết định với những sự kiện thực tế. Và một công ty tỏ ra xuất sắc trong việc khai thác chuỗi giá trị phân tích chính là Google.
Google là một trong những công ty thành công nhất thế giới. Họ có 28.000 nhân viên hay còn gọi là “Googler” tại 60 trụ sở trên khắp hơn 30 quốc gia. Không như các bộ phận nhân sự khác, đội ngũ
nhân sự của Google khẳng định mục tiêu rằng: “Mọi quyết định về nhân sự tại Google đều dựa trên dữ liệu và phân tích17.”
Google biết rằng hầu hết các quyết định về nhân sự đều dựa trên quan điểm. Theo cảm tính kiểu “Tôi thấy hài lòng với người này”, hay kiểu nhận định dựa trên sự thiên vị vô thức của người ra quyết định cuối cùng thường đóng vai trò lớn hơn trong việc tuyển dụng – một điều mà chẳng ai trong chúng ta chịu thừa nhận.
Vấn đề nhân sự vốn dĩ đã luôn là một kho dữ liệu – ai đang làm việc cho công ty, họ đã công tác ở đó được bao lâu, họ đã có bao nhiêu ngày nghỉ ốm, họ làm được bao nhiêu, lần cuối họ được thăng chức là khi nào, họ quản lý bao nhiêu người, phẩm chất của họ ra sao...
Như hầu hết các công ty khác, Google cũng nhận ra rằng chỉ có dữ liệu có cấu trúc thô là chưa đủ. Điều quan trọng là chúng ta phải thấu hiểu được từ dữ liệu đó và áp dụng những chỉ số hiệu suất cốt yếu. Những chỉ số này khá thú vị vì chúng thậm chí còn cung cấp nhiều thông tin hơn dưới dạng tỷ lệ, số lượng hay xu hướng của những điều đang diễn ra trong công ty theo thời gian. Thách thức đối với các chỉ số là khi ta công bố một bảng chỉ số thường xuyên đến một lượng người vừa đủ, chúng sẽ trở nên tê liệt trên tấm bảng đó. Google tin rằng các chỉ số rất quan trọng, vì chúng đóng vai trò là xuất phát điểm để chúng ta hiểu được những gì đang diễn ra, nhưng lại không nhất thiết phải hỗ trợ cho việc ra quyết định hoặc thúc đẩy hành động.
Sau đó, Google phân tích các chỉ số và dữ liệu để xác định các mối quan hệ và tương quan bên trong dữ liệu, nhận diện các xu hướng và các tập hợp đặc biệt. Cuối cùng, điều này sẽ dẫn đến những hiểu biết ảnh hưởng đến người ra quyết định và hành động. Sau đó, những tri thức này lại được gắn vào quy trình, chính sách doanh nghiệp hoặc sáng kiến mới để tạo thành lợi ích trong công ty.
Dự án Oxy là một ví dụ cho quy trình khởi đầu với quan điểm và kết thúc với hành động.
Nghiên cứu tình huống: Dự án Oxy
Dự án Oxy được tiến hành bởi Phòng thí nghiệm Con người và Đổi mới (PiLab – People and Innovation Lab), một bộ phận của nhóm phân tích con người thuộc Google. PiLab là một nhóm các nhà xã hội học, những người thường hoạt động nhóm với các nhà nghiên cứu hàn lâm để giải đáp một số câu hỏi hoặc các vấn đề dài hạn của Google. Họ xử lý những thách thức vốn không phải mối quan tâm cấp thiết đối với doanh nghiệp, nhưng dù sao cũng có thể từ đó để cải thiện hiệu suất và mang đến đột phá quan trọng.
PiLab thường xem xét các vấn đề quan trọng đối với năng suất, hiệu suất và thành công, nhưng không quá cấp thiết. Sứ mệnh của họ là “tiến hành nghiên cứu cách tân để biến đổi hoạt động của chúng ta trong phạm vi Google và hơn thế nữa”.
Một trong những giai thoại hay quan điểm nổi lên từ những ngày đầu tại Google chính là: “người quản lý không quá quan trọng”. Là một công ty công nghệ, công việc gắn với chức vị cao nhất mà mọi người đều thèm muốn chính là công việc về công nghệ, chứ không phải công việc về quản lý. Trên thực tế, các nhà đồng sáng lập của Google, Larry Page và Sergey Brin (cả hai đều là những chuyên gia công nghệ, kỹ thuật và tin học siêu hạng) đã đảm bảo rằng những người quản lý không đóng vai trò quá quan trọng trong doanh nghiệp, họ đã quyết định sa thải tất cả bọn họ và biến mỗi người thành một cá nhân đóng góp đơn lẻ. Cách này không hiệu quả và công ty phải mời các nhà quản lý trở về. Nhưng “vết sẹo” vẫn còn đó, các nhà quản lý thực sự không làm được gì nhiều; họ gần như không có giá trị và không được xem trọng như các chuyên gia công nghệ. Quan điểm hay giả thiết thịnh hành vào thời đó là nếu các quản lý nhân sự bất đồng với các chuyên gia công nghệ trên bàn họp, thì điều đó cũng không thực sự có tác động gì đáng kể.
Thế nên, PiLab đã bắt đầu xác minh xem “vết sẹo” này có hợp lý hay không. Để làm điều đó, họ bắt đầu với một câu hỏi: “Các nhà quản lý có thực sự tạo ảnh hưởng tích cực ở Google không?”
Điều đầu tiên họ làm là xem xét những nguồn dữ liệu sẵn có: các đánh giá hiệu suất và khảo sát nhân viên. Nhiều doanh nghiệp cũng từng xem xét các loại nguồn dữ liệu trên từ hai lập trường khác
nhau: từ dưới lên (khảo sát nhân viên) và từ trên xuống (đánh giá hiệu suất). Thể hiện kết quả trên biểu đồ, tất cả các nhà quản lý đều sẽ trông có vẻ đạt thành tích ngang ngửa và đang làm tốt công việc. Nhưng biểu đồ lại không trả lời được câu hỏi: “Các nhà quản lý có thực sự tạo ảnh hưởng tích cực ở Google không?”
Để trả lời câu hỏi này, họ cần phải xem xét dữ liệu kỹ hơn và phân chúng thành nhiều phần, đặc biệt là để mắt đến nhóm ¼ đứng đầu (các quản lý giỏi nhất) và nhóm ¼ đứng cuối (các quản lý kém nhất). Họ cũng phân tích sâu hơn hiệu suất làm việc của các nhà quản lý giỏi nhất và kém nhất, dựa trên các yếu tố trong đội ngũ của họ như năng suất nhóm, mức độ vui vẻ của nhân viên, khả năng nhân viên của họ ở lại với công ty... Và kết quả thật đáng ngạc nhiên. Tuy hầu hết các nhà quản lý đều có thành tích gần ngang bằng nhau trên biểu đồ, nhưng kết quả điều tra sâu hơn, bao gồm cả phân tích hồi quy lại làm nổi bật những điểm khác biệt đáng kể theo thống kê giữa các nhà quản lý giỏi nhất và kém nhất trong nhóm.
Phép phân tích trên rõ ràng đã trả lời được câu hỏi. Các nhà quản lý đóng vai trò quan trọng và họ có thể tạo ảnh hưởng tích cực đến Google.
Nhưng chỉ có thông tin thì thực sự chẳng thay đổi được gì cả. Nên họ đã đặt ra các câu hỏi mới… “Điều gì làm nên một nhà quản lý giỏi ở Google?”
Nếu nhóm nghiên cứu tại Pilab có thể tách riêng các vấn đề tạo nên sự khác biệt, thì những hiểu biết đó sẽ được sử dụng để giúp các nhà quản lý đang gặp khó khăn cải thiện và định hướng công tác tuyển dụng trong tương lai. Họ không biết những nhà quản lý giỏi trở nên giỏi giang bằng cách nào, hay điều gì khiến họ làm việc hiệu quả hơn so với người khác.
Để trả lời câu hỏi mới này, PiLab đã triển khai hai nghiên cứu định tính khác. Nghiên cứu đầu tiên giới thiệu một giải thưởng có tên là Giải thưởng Quản lý Xuất sắc. Theo giải đó, các báo cáo trực tiếp có thể bổ nhiệm một nhà quản lý bằng cách trình bày những ví dụ
về hành vi mà họ nghĩ là cần thiết ở người quản lý giành chiến thắng. Sau đó, dữ liệu này sẽ được mã hóa và phân tích để tìm xem có ví dụ chung nào ở các nhà quản lý xuất sắc không.
Cùng lúc đó, họ lại tiến hành một nghiên cứu dạng phỏng vấn theo kiểu mù đôi18 để đối thoại với những nhà quản lý thuộc các nhóm ¼ đầu và cuối, tuy cả người phỏng vấn lẫn người được phỏng vấn đều không biết đối tượng thuộc nhóm nào. Một lần nữa, bản ghi âm các cuộc phỏng vấn lại được mã hóa và phân tích với mục đích tìm hiểu xem những nhà quản lý xuất sắc có điểm chung gì, rồi so sánh chúng với đặc điểm của những nhà quản lý không xuất sắc lắm.
Dựa trên dữ liệu này, họ tổng hợp lại tám hành vi thường gặp ở các nhà quản lý giỏi nhất tại Google, cùng với ba hạn chế mà những nhà quản lý “có vấn đề” thường phạm phải:
Một nhà quản lý giỏi ở Google sẽ:
1. Là một huấn luyện viên giỏi.
2. Trao quyền cho nhóm và không soi xét tiểu tiết.
3. Thể hiện sự quan tâm/lo lắng đối với thành công và lợi ích cá nhân của từng thành viên trong nhóm.
4. Đạt năng suất cao và hướng đến kết quả.
5. Là người giao tiếp giỏi – biết lắng nghe và chia sẻ thông tin. 6. Giúp nhân viên phát triển sự nghiệp.
7. Có tầm nhìn/chiến lược rõ ràng cho nhóm.
8. Sở hữu những kỹ năng chuyên môn quan trọng để đưa lời khuyên cho nhóm.
Chúng ta rất dễ đọc hết danh sách tám đặc điểm trên và nghĩ đó là điều hiển nhiên. Chắc chắn nếu bạn yêu cầu mọi người kể tên
những điểm đặc trưng ở một nhà quản lý xuất sắc, họ sẽ đề cập đến khoảng 20-30 hành vi, bao gồm tám đặc điểm trên. Như vậy, kết quả phân tích nhân sự đã nhận diện chính xác tám hành vi có tác động lớn đến các nhà quản lý tại Google.
Những hạn chế có thể khiến một nhà quản lý gặp khó khăn bao gồm:
1. Được thuyên chuyển quá đột ngột (ví dụ như bất ngờ được thăng chức hay chiêu mộ từ bên ngoài mà không qua đào tạo);
2. Thiếu một triết lý/cách tiếp cận nhất quán để quản lý hiệu suất và phát triển sự nghiệp;
3. Dành quá ít thời gian cho việc quản lý và giao tiếp.
Những thấu hiểu trên vô cùng hữu ích tại Google là do chúng đã thôi thúc họ có những hành động thậm chí còn xa hơn và bắt đầu đánh giá con người dựa trên các đặc điểm này. Google đã tiến hành các khảo sát phản hồi cấp trên, theo đó mỗi nhân viên cấp dưới của người quản lý sẽ đánh giá sếp của họ hai lần mỗi năm, rồi gửi kết quả cho người đó. Sau đó, người quản lý sẽ hiểu được kỳ vọng dành cho họ và sẽ hành động để cải thiện những khía cạnh còn yếu – đặc biệt là xung quanh tám đặc điểm tích cực và ba hạn chế nói trên. Google đã tiếp tục tổ chức Giải thưởng Quản lý Xuất sắc để vinh danh những người làm thật tốt các việc trên, từ đó trở thành tấm gương để những quản lý khác noi theo.
Ngoài ra, Google cũng thiết kế lại các chương trình đào tạo quản lý và lập những kế hoạch truyền thông mới để mọi người biết họ đang được đánh giá trên những mặt nào, cũng như các cách thức làm việc tốt nhất ở Google là gì.
Từ đó, Google đã chuyển từ quan điểm: “Các nhà quản lý không tác động đến hiệu suất” sang sử dụng dữ liệu và các chỉ số để chứng minh rằng các nhà quản lý xuất sắc cũng có ảnh hưởng đáng kể đến hiệu suất của nhóm, gắn kết nhân viên, khuyến khích nhân viên và năng suất. Nhờ đúc kết được những hiểu biết từ phân tích đó,
Google đã có thể nhận diện và tổng hợp những điều tạo nên một nhà quản lý xuất sắc tại đây, cũng như những điều gây khó khăn cho những quản lý kém năng lực hơn. Sau đó, những hiểu biết này được gắn vào văn hóa của Google thông qua việc đánh giá những yếu tố, vốn đóng vai trò như một hệ thống cảnh báo sớm để phát hiện những quản lý giỏi cũng như đang gặp khó khăn. Đối với những người gặp khó khăn, họ có thể tiếp cận các nguồn hỗ trợ và khóa đào tạo nâng cao, cũng như vô số hình mẫu đã được phát hiện và vinh danh thông qua Giải thưởng Quản lý Xuất sắc19 để học hỏi.
Và tất cả những điều trên đều khả thi vì họ đã bắt đầu với một câu hỏi đúng đắn; sau đó, họ xác định lại câu hỏi cho đến khi có được một giả thiết thực tiễn và xác minh được, góp phần cải thiện hiệu suất quản lý xuyên suốt Google.
Khi bạn bắt đầu với một câu hỏi hoặc giả thiết và cố gắng tìm, phân tích riêng dữ liệu có thể trực tiếp trả lời câu hỏi đó, bạn sẽ chuyển từ trạng thái ngập chìm trong “toàn bộ dữ liệu” cùng nỗi lo rằng bạn sẽ cần thu thập và phân tích mọi thứ sang một câu hỏi hợp lý và có thể quản lý. Đó chính là sức mạnh của các câu hỏi SMART.
Sự thật này rõ ràng không qua được mắt của Eric Schmidt20, chủ tịch điều hành Google. Ông nói: “Chúng tôi điều hành công ty này bằng các câu hỏi, chứ không phải câu trả lời. Thế nên trong quy trình chiến lược, có lúc chúng tôi đề ra đến 30 câu hỏi cần phải trả lời... Anh muốn nó phải là một câu hỏi, chứ không phải một câu trả lời ngắn gọn, rồi từ đó kích thích cuộc đối thoại.”
Theo Nghiên cứu về Giới Kỹ thuật số vào năm 2013 của IDC, chỉ có 22% thông tin trong giới kỹ thuật số đáng để phân tích, và chỉ 5% thực sự được phân tích. IDC dự đoán rằng tỷ lệ phần trăm hữu ích này sẽ tăng lên hơn 35% vào năm 2020, và hơn 10% sẽ được phân tích để tạo nên những hiểu biết hữu ích đích thực. Do vậy, việc chúng ta cần học hỏi để tận dụng Dữ Liệu Lớn và các công nghệ phân tích mới mẻ, cũng như những nguồn dữ liệu mới, các định dạng dữ liệu ngày càng trở nên quan trọng, rồi áp dụng chúng vào
những bộ phận mới của doanh nghiệp một cách THÔNG MINH. Thế giới mới đầy can đảm này tượng trưng cho những cơ hội và những nguy cơ đáng kể. Khi khám phá chương tiếp theo, chúng ta sẽ biết có một lượng lớn dữ liệu đáng giá trong giới kỹ thuật số, nhưng nó đòi hỏi chúng ta phải có trí tuệ, sự quyết đoán và kỹ năng để tìm ra và đưa vào sử dụng21. Nếu bắt đầu với chiến lược, bạn sẽ làm được điều đó.
Trước khi khởi sự doanh nghiệp của bạn trong thế giới mới can đảm này, hãy bắt đầu với chiến lược, hình thành, làm rõ mục đích của bạn. Hãy đảm bảo bạn và đội ngũ điều hành hiểu rõ doanh nghiệp đang tìm cách đạt được điều gì. Một khi đã đặt ra mục tiêu này, hãy xác định 4-5 câu hỏi SMART cho mỗi phần trong bảng chiến lược SMART của bạn, xoay quanh khách hàng, tài chính, hoạt động, nguồn lực, cạnh tranh và rủi ro. Một khi đã biết những gì bạn cần từ các khía cạnh kinh doanh then chốt trên, hãy sử dụng các câu hỏi để định hướng cho chỉ số và dữ liệu mà bạn đo lường...
CÁC ĐIỂM CHÍNH VÀ LỜI KÊU GỌI HÀNH ĐỘNG
• Doanh nghiệp thông minh hơn luôn bắt đầu với chiến lược – bất kể quy mô ra sao.
• Thay vì bắt đầu với những dữ liệu lớn hoặc nhỏ mà bạn có thể hoặc sẽ tiếp cận (vốn là công thức để đảm bảo thất bại và bị dữ liệu nhấn chìm) hãy bắt đầu bằng cách vạch ra điều mà doanh nghiệp của bạn đang tìm cách đạt được.
• Hãy sử dụng bảng chiến lược SMART để xem xét những mục tiêu chiến lược đối với từng khía cạnh trong doanh nghiệp, từ đó cân nhắc xem bạn cần thông tin gì để trả lời 4-5 câu hỏi SMART cho từng khía cạnh:
− Chiến lược khách hàng của bạn là gì và bạn cần thông tin nào để hoàn thành chiến lược đó?
− Chiến lược tài chính của bạn là gì và bạn cần thông tin nào để hoàn thành chiến lược đó?
− Chiến lược hoạt động của bạn là gì và bạn cần thông tin nào để hoàn thành chiến lược đó?
− Bạn cần những nguồn lực nào để thực hiện các mục tiêu về khách hàng, tài chính và hoạt động? Và bạn cần thông tin nào để làm được điều đó?
− Bạn sẽ đối mặt với những đối thủ và rủi ro nào khi tìm cách tiến hành chiến lược của mình? Và bạn cần thông tin nào để làm được điều đó?
• Ngoại lệ duy nhất để bắt đầu với chiến lược là khi bạn đã có sẵn một nguồn cung cấp dữ liệu số hóa dồi dào. Trong trường hợp này, hãy dùng 10% ngân sách để khám phá dữ liệu và xem chúng có chỉ ra bất kỳ mối tương quan không ngờ đến hay cơ hội kinh doanh nào không.
• Tuy nhiên, hãy nhớ rằng vòng đời của dữ liệu khá ngắn. Việc dành quá nhiều thời gian và tiền bạc để số hóa sổ sách khách hàng cũ từ tận 20 năm trước có lẽ không phải là cách sử dụng nguồn lực hiệu quả nhất.
CHÚ THÍCH
15. Mayer-Schonberger, V. và Cukier K (2013) Sđd.
16. Nguyên văn: Centres for Disease Control (CDC).
17. Tham khảo cuốn Quy tắc của Google đã được Alpha Books xuất bản.
18. Nguyên văn: Centres for Disease Control.
19. Dekas, K. (2011) Strata Jumpstart: Kathryn Dekas, People analytics: Using data to drive HR strategy and action (tạm dịch: Khởi đầu vượt bậc: Kathryn Dekas, Phân tích con người: Sử dụng dữ liệu
để thúc đẩy chiến lược nhân sự và hành động). You Tube: http://www.youtube.com/watch?v=l6ISTjupig.
20. Press, Gil (2012) “Big Data News of the Week: Sexy and Social Data Scientists (tạm dịch: Tin tức Dữ Liệu Lớn trong tuần: Những nhà khoa học dữ liệu hấp dẫn và dễ gần)”. Forbes.com, số ra ngày 24/11/2012.
21. Nghiên cứu về Giới Kỹ thuật số của IDC (tháng 4/2014) do EMC2 tài trợ.
3M = Measure metrics and data - Đo lường các chỉ số và dữ liệu
T
rong những cuộc tranh cãi nảy lửa về Dữ Liệu Lớn, ta rất dễ quên rằng chúng chỉ là dữ liệu. Có thể hiện nay, chúng ta đang sở hữu nhiều dữ liệu hơn trước và có thể gồm cả nhiều định dạng dữ liệu
mới, nhưng chúng chỉ thực sự hữu ích nếu chúng ta có thể sử dụng chúng để trả lời các câu hỏi SMART.
Tuy nhiên, phần tiếp theo có thể khiến chúng ta phải cân nhắc lại quan điểm về “cơn sốt” Dữ Liệu Lớn. Nếu bạn lấy đi toàn bộ dữ liệu được tạo ra từ buổi bình minh của văn minh nhân loại cho đến năm 2010, lượng dữ liệu tương đương sẽ sớm tạo ra được cứ sau mỗi phút. Lấy thiên văn học làm ví dụ: Cho đến năm 2000, đã có một lượng dữ liệu cực lớn về một thực thể được thu thập; nhưng khi Khảo sát SDSS (Khảo sát bầu trời bằng kỹ thuật số Sloan) bắt đầu được tiến hành vào năm 2000, kính thiên văn của dự án này tại New Mexico đã thu thập được nhiều dữ liệu hơn toàn bộ lượng dữ liệu tích lũy xuyên suốt lịch sử ngành thiên văn chỉ sau vài tuần hoạt động. Trong một thập kỷ sau đó, 140 terabyte thông tin tiếp tục được thu thập. Trong trường hợp bạn thắc mắc lượng dữ liệu đó nhiều đến đâu, thì chúng tương đương với 700 nghìn bộ phim mà bạn phải xem liên tục trong gần 160 năm mới hết. Khi chiếc kính thiên văn thay thế chiếc tại New Mexico được phát trực tuyến vào năm 2016, nó sẽ có thể tập hợp khoảng 140 terabyte dữ liệu mỗi năm ngày22! Và nguyên nhân dẫn đến sự bùng nổ dữ liệu này chính là do quá trình dữ liệu hóa của thế giới cùng năng lực phân tích dữ liệu ngày càng nâng cao của chúng ta. Và về cơ bản, chính sự kết hợp các yếu tố quan trọng đó đã tạo nên “Dữ Liệu Lớn”.
Ý tưởng cơ bản phía sau cụm từ “Dữ Liệu Lớn” là mọi thứ chúng ta làm trong đời sớm muộn gì cũng sẽ để lại dấu vết kỹ thuật số (hay dữ liệu) – thứ có thể được sử dụng và phân tích.
Khả năng tận dụng lượng dữ liệu đang mở rộng hơn bao giờ hết này sẽ biến đổi hoàn toàn khả năng thấu hiểu thế giới của chúng ta, cũng như vạn vật trong thế giới đó. Và trong khi doanh nghiệp còn đang nắm bắt và phân tích dữ liệu suốt nhiều năm, thì quá trình dữ liệu hóa này lại cho thấy tỉ lệ thu thập dữ liệu mới của chúng ta đang tăng đến đáng sợ. Chẳng hạn, có 30 tỉ mẩu nội dung được đăng lên Facebook chỉ trong một ngày! Và “vũ trụ” kỹ thuật số đăng gấp đôi con số đó mỗi hai năm. Với tỉ lệ này, đến năm 2020, số lượng dữ liệu số thông tin trong “vũ trụ” kỹ thuật số sẽ gần bằng với số vì sao trong vũ trụ thật 23.
Bên cạnh đó, sự đột phá trong năng lực lưu trữ và xử lý của máy tính cũng đồng nghĩa với việc lần đầu tiên chúng ta có thể phân tích nhiều bộ dữ liệu hỗn hợp lớn, phức tạp. Trước khi tính đến việc tận dụng các chỉ số và dữ liệu, đầu tiên, chúng ta sẽ xem xét những hình thức và kiểu dữ liệu khác nhau, rồi thảo luận xem Dữ Liệu Lớn thực sự là gì, cũng như những mối quan tâm về quyền riêng tư xung quanh các bộ dữ liệu rộng lớn.
CÁC KIỂU DỮ LIỆU
Dữ Liệu Lớn, khoa học dữ liệu và các phương pháp phân tích kinh doanh vốn hoạt động dựa trên dữ liệu có cấu trúc và phi cấu trúc. Nhưng doanh nghiệp THÔNG MINH (SMART) sẽ xuất hiện khi chúng ta kết hợp những bộ dữ liệu sẵn có với dữ liệu phi cấu trúc hoặc nửa cấu trúc từ cả nguồn nội bộ lẫn bên ngoài.
Dữ liệu có cấu trúc
Dữ liệu có cấu trúc cung cấp hầu hết sự thấu hiểu kinh doanh, nhưng thường bị xem là “lỗi thời” và vô ích – đặc biệt nếu so với người anh em họ nổi tiếng của nó, dữ liệu phi cấu trúc. Chúng ta rất dễ bỏ qua dữ liệu có cấu trúc. Nhưng đó là một sai lầm, vì rất nhiều
hiểu biết từ Dữ Liệu Lớn được tạo ra bằng cách kết hợp dữ liệu có cấu trúc với phi cấu trúc.
Dữ liệu được đặt trong một miền cố định kèm theo một bản ghi chép hoặc tập tin xác định được gọi là dữ liệu có cấu trúc. Nó bao gồm cả những dữ liệu được chứa trong các cơ sở dữ liệu và bảng tính liên quan.
Các ví dụ về dữ liệu có cấu trúc bao gồm:
• Điểm dữ liệu bán hàng
• Dữ liệu tài chính
• Dữ liệu khách hàng.
Đúng như tên gọi, “dữ liệu có cấu trúc” là từ dùng để chỉ những dữ liệu hoặc thông tin có mô hình dữ liệu xác định trước hoặc được sắp xếp theo một phương thức định trước.
Mô hình dữ liệu là một mô hình của các kiểu dữ liệu kinh doanh mà doanh nghiệp của bạn sẽ ghi chép lại, cùng với cách thức lưu trữ, xử lý và truy cập những dữ liệu đó. Bên trong mô hình, các miền dữ liệu mà bạn muốn nắm bắt cần phải được xác định rõ ràng, và mọi nguyên tắc phải xoay quanh cách thức lưu trữ dữ liệu. Chẳng hạn, nếu bạn xem xét cơ sở dữ liệu khách hàng tiêu chuẩn, những miền dữ liệu cần định nghĩa sẽ bao gồm tên tuổi, địa chỉ, số điện thoại liên lạc, địa chỉ e-mail... Các nguyên tắc sẽ được đặt ra trong những miền đó, chẳng hạn như miền “số điện thoại” sẽ chỉ chấp nhận thông tin là chữ số. Những nguyên tắc này cũng bao gồm các trình đơn thả xuống (drop down menu) để giới hạn lựa chọn dữ liệu có thể được điền vào miền, từ đó đảm bảo đầu vào nhất quán. Chẳng hạn, miền “Danh xưng” trong cấu trúc họ tên có thể chỉ cho bạn những lựa chọn nhất định như Ông, Bà, Cô, Tiến sĩ...
Dữ liệu có cấu trúc đặt tên cho từng miền trong cơ sở dữ liệu và xác định mối quan hệ giữa các miền. Do vậy, dữ liệu có cấu trúc rất dễ nhập, dễ lưu trữ và dễ phân tích.
Cho tới tận gần đây, công nghệ vẫn chẳng thèm lưu trữ, chứ đừng nói đến phân tích hay bất kỳ thứ gì khác ngoài dữ liệu có cấu trúc. Mọi thứ không khớp với cơ sở dữ liệu hay bảng tính thường bị loại bỏ, hoặc lưu trên giấy hay vi phiếu trong các tủ đựng hồ sơ hay cơ sở lưu trữ.
Dữ liệu có cấu trúc thường được quản lý thông qua Ngôn ngữ Truy vấn có Cấu trúc (SQL – Structured Query Language) – một ngôn ngữ lập trình ban đầu do IBM tạo ra vào những năm 1970 để quản lý và truy vấn dữ liệu trong hệ thống quản lý cơ sở dữ liệu liên quan. SQL đại diện cho một bước nhảy vọt so với việc lưu trữ dữ liệu trên giấy và phân tích, nhưng không phải mọi thứ trong kinh doanh đều ăn khớp với một miền dữ liệu xác định trước.
Dữ liệu phi cấu trúc và bán cấu trúc
Dữ liệu phi cấu trúc và bán cấu trúc giống như những cô cậu nổi tiếng ở trường! Ai cũng bàn tán về chúng, và chúng đại diện cho ranh giới mới hấp dẫn mà Dữ Liệu Lớn ca ngợi. Theo ước tính, có đến 80% lượng thông tin liên quan đến kinh doanh bắt nguồn từ dữ liệu phi cấu trúc hoặc bán cấu trúc.
Chúng đại diện cho toàn bộ những dữ liệu không quá dễ để xếp vào từng hàng, từng cột hoặc từng miền. Chúng thường nặng về mặt văn bản, nhưng cũng có thể chứa đựng các dữ liệu như ngày tháng, số liệu, dữ kiện thực tế hoặc các kiểu dữ liệu khác như hình ảnh. Sự thiếu nhất quán này khiến việc phân tích chúng thông qua những chương trình máy tính truyền thống rất khó khăn.
Các ví dụ về dữ liệu phi cấu trúc và bán cấu trúc bao gồm: • Ảnh chụp và hình ảnh đồ họa;
• Các video;
• Các website;
• Tập tin văn bản hoặc tài liệu như e-mail, PDF, blog, bài đăng mạng xã hội...;
• Bài thuyết trình PowerPoint.
Dữ liệu bán cấu trúc là điểm giao giữa dữ liệu có cấu trúc và phi cấu trúc. Dữ liệu này có thể gồm một số cấu trúc có thể sử dụng trong phân tích, nhưng lại thiếu cấu trúc mô hình dữ liệu tuyệt đối. Đối với dữ liệu bán cấu trúc, chúng ta có thể sử dụng thẻ gán (tag) hoặc các hình thức đánh dấu khác để xác định những yếu tố nhất định trong dữ liệu, nhưng dữ liệu lại không có cấu trúc cố định. Chẳng hạn, bài đăng Facebook có thể được phân loại theo tác giả, dữ liệu, độ dài hay thậm chí mức độ đa cảm, nhưng nhìn chung nội dung của nó là phi cấu trúc. Một ví dụ khác là phần mềm xử lý văn bản bao gồm các siêu dữ liệu, liệt kê chi tiết tên người trình bày cùng thời điểm lập và chỉnh sửa; nhưng nội dung tài liệu vẫn là phi cấu trúc.
Dữ liệu nội bộ
Dữ liệu nội bộ đại diện cho tất cả thông tin mà doanh nghiệp hiện có và có thể truy cập.
Chúng bao gồm các dữ liệu riêng tư, độc quyền mà doanh nghiệp, nơi bạn kiểm soát quyền truy cập, thu thập và sở hữu.
Các ví dụ về dữ liệu nội bộ bao gồm:
• Phản hồi từ khách hàng
• Dữ liệu bán hàng
• Dữ liệu khảo sát nhân viên hoặc khách hàng
• Dữ liệu video trên máy quay an ninh
• Dữ liệu giao dịch
• Dữ liệu hồ sơ khách hàng
• Dữ liệu kiểm soát hàng tồn kho
• Dữ liệu nhân sự.
Xin nhắc lại, giống như dữ liệu có cấu trúc, dữ liệu nội bộ không quá hấp dẫn; hầu như tất cả đều tập trung hoàn toàn vào những dữ liệu bên ngoài mà họ hiện chưa có. Xin nhắc lại một lần nữa, đây là sai lầm.
Dữ liệu bên ngoài
Dữ liệu bên ngoài là một chuỗi thông tin vô tận tồn tại bên ngoài doanh nghiệp.
Dữ liệu bên ngoài có thể công khai hoặc riêng tư. Dữ liệu công khai là dữ liệu mà ai cũng có thể sở hữu – bằng cách thu thập miễn phí, trả tiền cho bên thứ ba hoặc thuê bên thứ ba thu thập hộ. Dữ liệu riêng tư thường đòi hỏi bạn phải tìm nguồn và trả tiền cho một doanh nghiệp khác hoặc bên thứ ba chuyên cung cấp dữ liệu để có được chúng.
Các ví dụ về dữ liệu bên ngoài bao gồm:
• Dữ liệu thời tiết
• Dữ liệu chính phủ, ví dụ như dữ liệu điều tra dân số • Dữ liệu Twitter
• Dữ liệu hồ sơ mạng xã hội
• Google Trends hoặc Google Maps.
Rất nhiều cơn sốt Dữ Liệu Lớn tập trung vào dữ liệu phi cấu trúc, sự lôi cuốn và triển vọng của dữ liệu bên ngoài; và thường lãng phí hoặc bỏ qua dữ liệu nội bộ hay có cấu trúc.
Điều hết sức quan trọng là chúng ta phải hiểu rằng: không có kiểu dữ liệu nào vốn dĩ tốt hơn hoặc đáng giá hơn kiểu dữ liệu khác.
Điểm mấu chốt là bạn phải bắt đầu với chiến lược và xác lập các câu hỏi SMART, để những câu hỏi đó dẫn bạn đến với các dữ liệu có cấu trúc hoặc phi cấu trúc, nội bộ hoặc bên ngoài tốt nhất nhằm giải đáp chúng và thực thi chiến lược.
Nhưng trước khi tìm hiểu làm điều đó như thế nào, hãy dành ít phút để đánh giá các hình thức dữ liệu mới – những dữ liệu mà giờ đây bạn có thể tùy ý sử dụng khi tìm cách trả lời các câu hỏi trên.
DỮ LIỆU HÓA: CÁC HÌNH THỨC DỮ LIỆU MỚI
Hầu hết các hoạt động do con người và máy tính hiện nay đều có dấu vết kỹ thuật số (hoặc dữ liệu), mà chúng ta có thể thu thập và phân tích nhằm mang đến hiểu biết về mọi vấn đề, từ sức khỏe, tội phạm cho đến hiệu suất kinh doanh. Đối với một số ít hoạt động hiện chưa để lại dấu vết kỹ thuật số, thì chúng sẽ sớm có mà thôi.
Thế giới đang bị “dữ liệu hóa” và hiện đang có rất nhiều hình thức dữ liệu hữu ích. Một số hình thức dữ liệu còn khá mới như bài đăng mạng xã hội; còn số khác đã xuất hiện từ lâu. Chẳng hạn, chúng ta đã có thể ghi âm các cuộc trò chuyện từ lâu, nhưng chính việc thiếu dung lượng lưu trữ và cách thức phân tích những bản ghi đó đã giới hạn công dụng của chúng. Tuy nhiên, mọi thứ đang thay đổi.
Hiện nay, dữ liệu có thể được khai thác từ:
• Các hoạt động của chúng ta
• Các cuộc đối thoại
• Ảnh chụp và video
• Các cảm biến
• Internet Vạn Vật.
Dữ liệu hoạt động
Ngày càng có nhiều hoạt động mà chúng ta tham gia đang để lại dấu vết dữ liệu.
Chẳng hạn, khi chúng ta lên mạng, trình duyệt sẽ ghi lại những gì chúng ta tra cứu và các website mà chúng ta truy cập. Hầu hết các website sẽ ghi lại bao nhiêu người truy cập, dừng lại ở mục nào (sử dụng ISP24 vi tính), thời gian truy cập và cách họ nhấp chuột, chuyển hướng trên trang đó như thế nào. Thông thường, thông tin này sẽ được sử dụng để đánh giá hiệu quả của website và loại bỏ các mục không có người truy cập, đồng thời cải thiện những trang được quan tâm nhiều nhất.
Nếu chúng ta quyết định mua sắm trực tuyến, website sẽ ghi lại những gì chúng ta thích, chia sẻ và mua; chúng ta trả bao nhiêu tiền, mua khi nào, giao hàng khi nào và thường là cả suy nghĩ của chúng ta về sản phẩm/dịch vụ thông qua phần phản hồi của khách hàng.
Nếu quyết định đọc một cuốn sách, nhiều khả năng chúng ta sẽ dần chuyển sang dùng Kindle, iPad, điện thoại thông minh hoặc một trình đọc điện tử khác. Hiện nay, đã có hàng triệu cuốn sách xuất hiện theo định dạng kỹ thuật số. Một số cuốn như sách giáo khoa công nghệ sẽ thay đổi nội dung rất nhanh, và thường không bao giờ được phát hành dưới dạng sách in.
Theo ước tính, đã có khoảng 130 triệu đầu sách riêng biệt được xuất bản kể từ khi máy in Gutenberg ra đời vào năm 1450. Đến năm 2012, tức chỉ bảy năm sau khi bắt đầu Dự án Sách Google (Google Book Project), Google đã quét hơn 20 triệu tựa sách, tương đương hơn 15% di sản sách giấy của toàn thế giới25. Amazon cũng cho phép chúng ta thoải mái tiếp cận nguồn sách cũ dưới định dạng kỹ thuật số.
Khi sử dụng trình đọc điện tử, chúng ta thường không chỉ đọc hình ảnh kỹ thuật số trong sách, mà văn bản cũng được dữ liệu hóa. Điều đó đồng nghĩa với việc chúng ta có thể thay đổi cỡ, phông chữ, thêm chú thích, làm nổi bật văn bản hoặc tra cứu trong sách. Trong
quá trình dữ liệu hóa, dữ liệu về nội dung chúng ta đọc, thời gian đọc, có nhảy trang hay không, chú thích ở trang nào và chọn đánh dấu ở đâu... đều sẽ được thu thập. Thông tin này chắc chắn hữu ích cho các tác giả và nhà xuất bản. Tôi rất muốn biết mọi người sử dụng sách của tôi như thế nào, bỏ qua những phần nào hay khi nào sẽ ngừng đọc. Điều này cho phép tôi – chính xác hơn là bất kỳ tác giả nào – điều chỉnh nội dung nhằm rút gọn hoặc cải thiện những phần nhất định mang lại trải nghiệm tốt hơn cho độc giả. Không những thế, các tác giả và nhà xuất bản cũng có thể nhận diện những lĩnh vực độc giả quan tâm từ các đoạn thường xuyên được đánh dấu trong nhiều cuốn sách, từ đó xác định các xu hướng chủ đề mới để thực hiện tác phẩm mới.
Nếu chúng ta nghe nhạc bằng điện thoại thông minh hay máy nghe nhạc kỹ thuật số, thì dữ liệu về những gì chúng ta nghe, thời gian nghe và các bản nhạc hay bị bỏ qua cũng sẽ được thu thập. Và các nghệ sĩ như Lady Gaga đang sử dụng dữ liệu để lập danh sách ca khúc cho các buổi nhạc sống, cũng như tạo ảnh hưởng đến những sáng tác trong tương lai.
Ngay cả việc đi bộ đến công sở hay đến phòng tập gym cũng phát sinh dữ liệu, nếu chúng ta đeo một thiết bị thông minh như vòng tay “Up” hoặc dùng ứng dụng trên điện thoại thông minh. Các ứng dụng và thiết bị này có thể đo số bước chân của chúng ta mỗi ngày, lượng ca-lo bị đốt cháy, chất lượng giấc ngủ, ghi lại các hoạt động và việc tập luyện, cũng như cung cấp thông tin và chúc mừng khi chúng ta đạt mốc. Một số thiết bị còn thường đo được nhịp tim và biến động nhịp tim của chúng ta (HRV26). HRV sẽ đo những thay đổi rất nhỏ trong khoảng thời gian giữa các nhịp tim, và đã được chứng minh là một chỉ số quan trọng nhằm chẩn đoán bệnh về tim. Chẳng hạn, năm 1965, có một phương pháp sản khoa phổ biến là theo dõi HRV của trẻ sơ sinh trong lúc chuyển dạ để phát hiện sớm dấu hiệu suy thai 27.
Năm 1997, Jacqueline Dakker, Giáo sư Dịch tễ học về bệnh tiểu đường tại Trung tâm Y tế thuộc Đại học VU, Amsterdam, đã cùng các đồng nghiệp khám phá ra HRV có thể dự đoán trước cái chết,
không chỉ đối với trẻ sơ sinh hay bệnh nhân đau tim, mà còn dự đoán “mọi nguyên nhân gây tử vong”28. Rõ ràng, dữ liệu về HRV rất hữu ích để chúng ta tìm hiểu; và các thiết bị thông minh sẽ thu thập được những dữ liệu đó.
Hiện nay, nhiều thiết bị mang theo người có thể được kích hoạt trên Internet, nên bản thân chúng đã là nguồn sản sinh và chia sẻ dữ liệu. Một điều gần như không thể tránh khỏi là các thiết bị và ứng dụng mang theo người hiện nay sẽ bị đồng hồ đeo tay thông minh nuốt chửng, giống như cách iPhone đã nuốt chửng iPod.
Jawbone, công ty sản xuất vòng tay “Up”, hiện đang thu thập dữ liệu giấc ngủ từ hàng triệu người trên khắp thế giới (bao gồm cả tôi). Điều này đồng nghĩa họ có quyền truy cập độc nhất vào dữ liệu giấc ngủ trong cả năm thông qua việc thu thập hằng đêm! Không công ty nào trên hành tinh này có loại dữ liệu đó, hay khối lượng dữ liệu như vậy. Sau đó, Jawbone có thể phân tích dữ liệu để tìm hiểu về giấc ngủ, về các hành vi khi ngủ của chúng ta và điều gì làm gián đoạn các hành vi đó. Chẳng hạn, Jawbone có thể quan sát dữ liệu và tính xem trung bình có bao nhiêu giờ ngủ bị mất khi trận chung kết Superbowl được phát sóng tại Mỹ, hoặc khách du lịch thường mất bao lâu để ngủ lại như bình thường sau khi di chuyển từ New York đến San Francisco, hay từ London đến Sydney.
Dữ liệu đối thoại
Chúng ta cũng ngày càng để lại nhiều ghi chép kỹ thuật số trong các cuộc đối thoại – bất kể thông qua văn bản khi chúng ta soạn tin nhắn SMS, trên mạng xã hội hay khi ghi âm lại một cuộc gọi.
Hãy nghĩ đến hàng tỉ e-mail đươc gửi đi và lưu trữ mỗi tuần. Trên thực tế, có đến 20 triệu e-mail đang được viết trong khoảng thời gian bạn đọc xong câu này29.
Chúng ta đang sử dụng phương tiện truyền thông xã hội để giao tiếp và tương tác với nhau, từ đó tạo nên những khối dữ liệu vô tận. Hãy điểm qua các thông số sau:
• Có hơn 1 tỉ dòng tweet được gửi đi mỗi 48 giờ.
• Có 1 triệu tài khoản mới được lập trên Twitter mỗi ngày.
• Cứ mỗi phút, lại có 293.000 dòng cập nhật trạng thái được đăng lên Facebook.
• Cứ mỗi giây, lại có hai thành viên mới tham gia LinkedIn (tức 172.000 người/ngày).
• 72% người trưởng thành lên mạng có sử dụng các trang mạng xã hội.
• 25% người dùng Facebook chẳng hề bận tâm đến bất kỳ biện pháp bảo mật cá nhân nào.
• Tính trung bình mỗi tháng, một người dùng Facebook tạo ra 90 đoạn nội dung bao gồm liên kết, các câu chuyện mới, album ảnh, bài viết và video.
• Thật khó tin là người dân tại New York nhận được các dòng tweet về trận động đất vào tháng Tám năm 2011 tại Mineral, Virginia khoảng 30 giây trước khi cảm nhận được nó30.
Ngoài ra, còn có hàng triệu website và blog tham gia vào cuộc đối thoại. Theo ước tính, có 571 website mới được lập ra mỗi phút trong ngày. Và cứ mỗi phút, các chủ tài khoản Tumblr tại đăng xấp xỉ 27.778 bài blog mới, ngoài ra còn có 3 triệu trang blog mới xuất hiện trên mạng mỗi tháng31.
Thêm vào đó là những dữ liệu được thu thập từ các cuộc trò chuyện điện thoại. Nếu gọi đến bộ phận chăm sóc khách hàng, chúng ta luôn được thông báo rằng cuộc gọi đó có thể được ghi âm. Thông thường, dữ liệu này sẽ khai thác nội dung và cảm xúc trong đó, thậm chí phân tích mức độ căng thẳng trong giọng nói của một người để đánh giá xem khách hàng bực bội đến mức nào.
Người ta cũng đang sử dụng dữ liệu ghi âm để cải thiện phần mềm nhận diện giọng nói và phiên dịch. Chẳng hạn, năm 2006, Google từng quyết định đầu tư mạo hiểm vào mảng dịch thuật như một phần của sứ mệnh “tổ chức lại thông tin của thế giới và khiến chúng trở nên hữu ích, dễ tiếp cận rộng rãi”. Hầu hết các phần mềm dịch thuật đều tận dụng tối đa các trang văn bản dịch để lập ra thuật toán, nhưng Google lại tận dụng toàn bộ mạng lưới Internet toàn cầu, và hơn thế nữa. Hệ thống của họ khai thác từng bản dịch – dù tốt hay tồi – có thể tìm ra để “huấn luyện” máy tính dịch thuật. Nhờ lượng dữ liệu mà họ có thể truy cập và sử dụng, phần mềm dịch của Google đã trở nên chính xác hơn bất kỳ hệ thống nào khác. Đến giữa năm 2012, bộ dữ liệu của họ đã bao gồm hơn 60 ngôn ngữ và chấp nhận cho nhập giọng nói từ 14 ngôn ngữ, để dịch lại một cách trơn tru32. Nó vẫn chưa hoàn thiện, nhưng nếu hệ thống tiếp tục học hỏi từ những lần dịch đúng và sai, thì cơ hội vẫn còn ở phía trước.
Dữ liệu ảnh chụp và hình ảnh video
Một lần nữa, cách chúng ta thu thập và lưu trữ dữ liệu thật đáng kinh ngạc. Máy ảnh kỹ thuật số cùng điện thoại thông minh đang chụp và chia sẻ được nhiều ảnh chụp, video hơn bao giờ hết. Hãy xem qua các thông số sau:
• Mỗi ngày, có 350 triệu bức ảnh chụp được đăng tải lên Facebook, tương đương 4.000 bức/giây.
• Người dùng Flickr đăng 3,5 triệu bức ảnh lên trang này mỗi năm. • Có xấp xỉ 100 giờ video được đăng lên YouTube mỗi phút. • Có hơn 45 triệu bức ảnh được đăng lên Instagram mỗi ngày.
• Đến tháng Sáu năm 2013, người dùng Instagram đã chia sẻ hơn 16 tỉ bức ảnh33.
Thoạt trông, việc chia sẻ bức ảnh về bữa ăn tối, hay bức ảnh chụp chú cún Labrador mới sẽ không làm thay đổi thế giới. Nhưng chính
sự dư thừa ảnh chụp, video (và dữ liệu văn bản) mới thực sự cứu sống mạng người ở những khu vực hứng chịu thảm họa.
Ví dụ, khi cơn bão Hải Yến đổ bộ vào Philippines năm 2013, có hơn 6.000 người đã thiệt mạng và 1,1 triệu ngôi nhà bị hư hỏng, hoặc bị phá hủy hoàn toàn chỉ trong vài giờ. Tại Anh Quốc, một nhóm tình nguyện viên đã lập ra một tấm bản đồ quan trọng về những vùng bị thiệt hại mà chỉ sử dụng mạng xã hội. Do hiện nay, mọi người rất hay chia sẻ những trải nghiệm của họ tại thời điểm gần như mới xảy ra, nên ảnh chụp, dòng tweet (kèm hashtag #Hiayan) và video về thảm họa đã được đăng trên mạng xã hội. Kết quả là từ cơn bão Hải Yến, nhóm tình nguyện viên đã nhận được trung bình hàng triệu bức ảnh, tin nhắn, bài tweet, video... mỗi ngày.
Sau khi lọc qua hàng triệu tin nhắn bằng công nghệ nhân tạo để chọn ra những tin quan trọng, nhóm tình nguyện viên đã đánh giá những gì họ quan sát được. Chẳng hạn, đối với một bức ảnh, họ sẽ hỏi: “Anh thấy thiệt hại đến mức nào?” rồi đơn giản nhấp vào các phím tương ứng: “không có”, “nhẹ” và “nghiêm trọng”. Đối với các tin nhắn văn bản như dòng tweet hoặc dòng cập nhật trạng thái trên Facebook, tình nguyện viên sẽ được yêu cầu quyết định xem văn bản “không liên quan”, “đề nghị giúp đỡ”, “thiệt hại về cơ sở hạ tầng”, “dần di dời người dân” hay “liên quan nhưng thuộc mảng khác”... Sau đó, mỗi mẩu dữ liệu (ảnh chụp, video hoặc tin nhắn) sẽ được 3-5 người khác nhau đánh giá để đảm bảo nhất quán và chính xác tương đối.
Bằng cách đánh dấu nơi dữ liệu xuất phát từ Philippines (sử dụng bộ cảm biến GPS đối với ảnh chụp hoặc tin nhắn văn bản), nhóm tình nguyện viên đã vạch ra được một bản đồ trực tuyến, không chỉ cho vùng thảm họa mà phục vụ cả nhu cầu ở từng khu vực.
Điều này đồng nghĩa khi nỗ lực xoa dịu thảm họa xuất hiện tại Philippines, họ không cần mất nhiều ngày tìm hiểu xem chuyện gì đã xảy ra và khu vực nào chịu thiệt hại nặng nề nhất. Từ bản đồ do những người cách đó nửa vòng Trái đất lập ra, họ cũng biết được ai cần nước, ai cần thực phẩm, nơi nào tìm thấy thi thể và nơi nào người dân được di dời, nơi nào hứng chịu nhiều thiệt hại nhất và
nơi nào các bệnh viện chịu ít tổn thất nhất, từ đó có thể giúp đỡ những người bị thương tốt hơn34.
Quá hay phải không nào?
Bên cạnh việc toàn bộ dữ liệu ảnh chụp và video đều do các cá nhân cung cấp, ở đây còn có dấu ấn của máy quay an ninh. Ngày qua ngày, các công ty có thể ghi hình video các cơ sở hoặc cửa hàng bán lẻ của họ, rồi lưu lại băng ghi hình trong một tuần hoặc hơn, trước khi ghi đè lên băng cũ. Hiện nay, một số cửa hàng lớn ý thức về dữ liệu còn giữ lại mọi cảnh quay của máy quay an ninh, rồi phân tích chúng để nghiên cứu xem mọi người vào cửa hàng như thế nào, dừng lại ở đâu, họ xem món gì và mất bao lâu để đưa ra các lựa chọn, rồi biến chúng thành doanh số. Một số nơi thậm chí còn sử dụng phần mềm nhận diện khuôn mặt. Thế nên, chẳng bao lâu nữa, tập hợp các nguồn dữ liệu như băng ghi hình từ máy quay an ninh, thông tin từ thẻ khách hàng thân thiết và phần mềm nhận diện khuôn mặt sẽ giúp chúng ta được cửa hàng chào đón từ trên điện thoại thông minh, rồi dẫn chúng ta đến đúng các mặt hàng hay chương trình khuyến mãi mà chúng ta có thể quan tâm, dựa trên thói quen mua hàng trước đây của chính chúng ta.
Dữ liệu cảm biến
Còn có một lượng dữ liệu do các bộ cảm biến tạo ra và lan truyền cũng đang không ngừng tăng lên. Ngày nay, các bộ cảm biến có ở mọi nơi.
Bạn có bao giờ tự hỏi thứ gì giúp cho điện thoại thông minh trở nên “thông minh” (hay bất kỳ thiết bị thông minh nào khác)? Về cơ bản, yếu tố giúp chúng trở nên thông minh là sự hiện diện của nhiều bộ cảm biến khác nhau với vai trò nắm bắt dữ liệu. Chẳng hạn, trong điện thoại thông minh của bạn, chúng chính là:
• Cảm biến GPS
• Cảm biến gia tốc
• Cảm biến con quay hồi chuyển
• Cảm biến từ
• Cảm biến ánh sáng
• Cảm biến công nghệ Giao tiếp Tầm Ngắn (NFC – Near Field Communications).
Cảm biến GPS (hay Hệ thống Định vị Toàn cầu – Global Positioning System) cho phép chúng ta và những người khác biết được nơi chúng ta đang sử dụng hệ thống điều hướng vệ tinh GPS. Các cảm biến GPS trong điện thoại có thể xác định vị trí của chúng ta trong vài mét (tất nhiên nếu giả định rằng chúng ta mang theo điện thoại). Cảm biến gia tốc (Accelerometer) là một loại cảm biến chuyển động chuyên đo gia tốc, tức đo xem điện thoại đang di chuyển nhanh thế nào. Chính công nghệ này đã cho phép bạn chụp ảnh nét hơn bằng điện thoại thông minh, vì nó chỉ kích hoạt màn trập khi phát hiện điện thoại đứng yên hay ổn định. Cảm biến con quay hồi chuyển (Gyroscope được dùng để duy trì hướng chuyển động và xoay màn hình. Đây là loại cảm biến thường được tận dụng trong các ứng dụng trò chơi, khi bạn phải nghiêng màn hình để di chuyển nhân vật hoặc lái xe. Và đúng như tên gọi, cảm biến từ (Proximity sensor) chuyên dùng để cảm nhận từ trường và cho biết chúng ta đang ở gần đối tượng hoặc địa điểm khác ra sao. Cảm biến ánh sáng (Ambient sensor) là loại chuyên phát hiện những thay đổi từ môi trường hoặc bầu khí quyển, từ đó điều chỉnh đèn rọi trên điện thoại hoặc tiết kiệm pin khi không được chủ động kích hoạt. Cuối cùng, cảm biến NFC là một trong những giao thức giao tiếp tân tiến nhất được tích hợp vào các điện thoại thông minh. Khi kích hoạt, các cảm biến này sẽ cho phép bạn chuyển khoản chỉ bằng cách vỗ điện thoại, hoặc vẫy điện thoại gần bên một chiếc máy thanh toán tương ứng.
Còn có nhiều loại cảm biến khác trong môi trường tự nhiên, chẳng hạn như cảm biến dùng để đo mức độ lành mạnh, nhiệt độ và những thay đổi trong nước biển ở thời gian thực. Tại Nhật Bản, có các loại cảm biến trong đất để thu thập dữ liệu về độ màu mỡ của
đất trồng; và các công ty đang kết hợp dữ liệu đó với dữ liệu thời tiết. Sau đó, người làm nông có thể đăng ký theo dõi dịch vụ để tối ưu hóa thu hoạch bằng cách quyết định khối lượng và thời điểm bón phân cho cây trồng.
Ngày càng có nhiều máy móc được trang bị cảm biến để theo dõi hiệu suất và cung cấp thông tin về thời điểm thích hợp để chăm sóc hoặc sửa chữa.
Ví dụ, hãng Rolls Royce sản xuất gần một nửa động cơ máy bay chở khách trên toàn thế giới, bao gồm cả Trent 100, loại động cơ cung cấp cho những chuyến bay xuyên Đại Tây Dương. Khi hoạt động, những động cơ này đạt nhiệt độ cực cao đến mức khó tin –
bằng nửa nhiệt độ bề mặt Mặt trời và cao hơn 200 độ so với nhiệt độ nóng chảy của thứ kim loại làm ra chúng. Lý do duy nhất khiến chúng không tan chảy là vì động cơ được làm mát thông qua các
ngõ và kênh dẫn nước đặc biệt, giúp kim loại được cách nhiệt. Không cần phải nói, việc tìm hiểu mọi thứ hoạt động và hiệu quả ra sao là điều quan trọng sống còn, nếu bạn không muốn chiếc máy bay chở bạn đến thăm bạn bè tại New York bị tan chảy từ độ cao hơn 9.000 mét.
Chính vì thế, động cơ gồm toàn những bộ phận quan trọng được chế tạo cực kỳ chính xác, bao gồm một máy tính gắn liền đóng vai trò là bộ não của động cơ, kiểm soát cũng như thu thập thông tin theo dõi từ các bộ cảm biến gắn sâu bên trong nó. Máy tính có thể tính toán 40 tham số với tốc độ 40 lần mỗi giây, bao gồm nhiệt độ, áp suất và vận tốc của tua-bin.
Toàn bộ các phép đo lường được lưu trong máy tính và chuyển ngược về trụ sở Rolls Royce tại Derby, nước Anh thông qua vệ tinh. Và cả biệt đội tất cả các động cơ của Rolls Royce đều như vậy, với rất nhiều dữ liệu mà trong khi bạn đang xem xét chúng, một động cơ do Rolls Royce sản xuất lại cất cánh hoặc hạ cánh đâu đó trên thế giới cứ mỗi 2,5 giây.
Mỗi khi hàng nghìn động cơ như thế bay trên không, chúng lại thu thập những dữ liệu được truyền về trụ sở liên tục, cũng như không
ngừng sử dụng các phép phân tích dữ liệu tài tình để tìm kiếm điều bất thường diễn ra trong động cơ, hoặc bất kỳ dấu hiệu nào cho thấy nó cần được chăm sóc hay sửa chữa. Sau đó tại Derby, các máy tính sẽ lọc qua dữ liệu để xem xét những điểm bất thường. Nếu phát hiện ra, họ sẽ lập tức “cắm cờ” và một người sẽ tiến hành kiểm tra, gọi điện cho hãng hàng không nếu cần thiết cũng như quyết định nên làm gì – thường là trước khi sự cố leo thang thành vấn đề thực sự.
Do đó, các bộ cảm biến này sẽ tạo điều kiện tích cực cho công tác bảo dưỡng, dựa trên hiệu suất thực tế từ các động cơ thay vì chỉ một lịch phân công tự động nào đó theo thời gian. Thay vì mang cả một thiết bị đắt tiền ra chăm sóc sau mỗi ba hoặc sáu tháng, các bộ cảm biến này sẽ cho phép hãng hàng không bảo dưỡng hàng loạt động cơ với chi phí hiệu quả hơn rất nhiều. Và quan trọng hơn là chúng sẽ giúp máy bay trở nên an toàn hơn35.
Xe hơi hiện đại cũng được lắp đầy những bộ cảm biến tương tự để đo lường mọi thứ, từ lượng tiêu thụ xăng cho đến hiệu suất động cơ và một lần nữa cho phép chúng ta chăm sóc chúng một cách chủ động, đảm bảo hiệu năng lâu dài tốt hơn. Các bộ cảm biến cảnh báo người lái nếu họ tiến quá gần xe khác hoặc vật thể khác, đồng thời có thể giúp người lái đỗ xe song song mà không cần phải làm gì!
Trong ngành công nghiệp bán lẻ, từ lâu chúng ta đã thu thập dữ liệu thông qua mã vạch; tuy nhiên, các bộ cảm biến có tên Công nghệ Nhận dạng bằng sóng vô tuyến (RFID - Radio Frequency Identification) đang ngày càng được nhiều hãng bán lẻ sử dụng, tạo ra khối lượng dữ liệu nhiều gấp trăm, gấp nghìn lần hệ thống mã vạch thông thường36.
Vậy đấy, cảm biến có mặt ở mọi nơi.
Internet Vạn Vật
Internet Vạn Vật là thành quả của việc ngày càng có nhiều đối tượng được sản xuất với các bộ cảm biến gắn bên trong, và khả
năng khiến các đối tượng đó “giao tiếp” với nhau.
IDC mô tả IoT như sau:
“Một mạng lưới kết nối nhiều thiết bị (vật thể) – có dây lẫn không dây – với đặc trưng là khả năng dự liệu tự động, quản lý và giám sát. Nó vốn dĩ đã mang tính phân tích và hợp nhất, bao gồm không chỉ các thiết bị, hệ thống thông minh, mà còn khả năng kết nối, các nền tảng thiết bị, khả năng lập mạng lưới và ứng dụng, công tác phân tích và giao tiếp xã hội, cũng như các ứng dụng và giải pháp cho ngành theo chiều dọc. Nó còn vượt trội hơn cả phương thức giao tiếp liên máy móc truyền thống. Thực ra, bản thân nó còn vượt trên cả ngành công nghiệp Thông tin, Truyền thông và Công nghệ (ICT)37.”
Khái niệm này tìm hiểu những thứ đang và sẽ có thể là kết quả của những bước tiến từ công nghệ thông minh dựa trên cảm biến và những bước tiến to lớn nối giữa thiết bị, hệ thống và dịch vụ, vốn đã vượt xa hoạt động kinh doanh thông thường. Chẳng hạn, nhiều tập đoàn nghiên cứu như Gartner và ABI Research ước tính vào năm 2020, sẽ có từ 26 tỉ đến 30 tỉ thiết bị được kết nối không dây vào IoT. Và hệ thống thông tin nảy sinh từ đó cũng hứa hẹn tạo nên các mô hình kinh doanh mới, cải thiện các quy trình và hiệu suất kinh doanh, đồng thời giảm thiểu chi phí và những rủi ro tiềm ẩn.
Điều đó sẽ đến trong tương lai. Khi ấy, đồng hồ báo thức của bạn sẽ được tích hợp với tài khoản e-mail; và nếu cuộc họp sớm bị hủy, đồng hồ báo thức sẽ tự động đặt lại giờ báo chuông, từ đó tạm dừng luôn thời gian hoạt động của máy pha cà phê. Tủ lạnh sẽ tự biết bên trong có gì và đặt hàng trực tuyến để bù thêm mà bạn không phải làm gì. Bạn sẽ thay áo sơ mi, với một con chip thanh toán trên tay áo để trả tiền bữa trưa mà không cần dùng đến thẻ tín dụng.
Thiết bị mang theo người hoặc đồng hồ đeo tay thông minh sẽ theo dõi sức khỏe trong ngày, quan sát lượng calo nạp vào, đảm bảo bạn luôn hoạt động và không ngồi một chỗ quá lâu. Khi bạn bước vào xe và lái về nhà vào ban đêm, chiếc xe sẽ tự động kiểm tra lộ trình,
thông tin giao thông và thời tiết để đưa bạn về nhanh nhất, an toàn nhất có thể. Khi bạn về đến nhà, nhiệt độ phòng sẽ ở mức hoàn hảo, còn tủ lạnh sẽ báo cho bạn biết có thể làm món gì cho bữa tối dựa trên các nguyên liệu sẵn có.
Khi nghỉ ngơi để xem tivi cùng gia đình, bạn có thể thưởng thức một bộ phim giới hạn trên 18 tuổi; và khi cô con gái năm tuổi của bạn bước vào phòng, chiếc tivi thông minh sẽ dừng bộ phim lại và chuyển kênh. Và nếu mẹ bạn trông nom nhà cửa khi bạn đi vắng, chiếc thảm thông minh sẽ đo, theo dõi chuyển động và thói quen di chuyển của bà, có thể bà luôn vào bếp lúc 10 giờ 30 phút để pha cà phê mỗi sáng, hoặc luôn đi ngủ lúc 11 giờ đêm. Khi những thói quen đó thay đổi, bạn sẽ được thông báo để chăm nom và đảm bảo mọi thứ vẫn ổn.
Các mạng lưới có dây và không dây kết nối IoT thường sử dụng Giao thức Internet (IP – Internet Protocol). Những mạng lưới rộng lớn này sẽ tạo ra các khối dữ liệu khổng lồ có sẵn để phục vụ phân tích. Khi một vật thể sử dụng bộ cảm biến để cảm nhận môi trường và giao tiếp với vật thể khác, chúng sẽ trở thành những công cụ tìm hiểu mức độ phức tạp và hồi đáp đối phương một cách nhanh chóng. Kết quả là các hệ thống thông tin có thực đang dần được bố trí, và một số trong đó có thể hoạt động mà không cần sự can thiệp của con người.
Những chiếc máy quay siêu nhỏ chỉ bằng viên thuốc cũng đang thăm dò hệ tiêu hóa của con người và gửi về hàng nghìn bức ảnh giúp xác định căn nguyên của bệnh tật. Thiết bị nông nghiệp chính xác không dây cũng kết nối với dữ liệu được thu thập từ các vệ tinh, còn các bộ cảm biến dưới mặt đất có thể thuật lại điều kiện đất trồng và điều chỉnh cách trồng trọt tại từng khu vực riêng trên cánh đồng. Ngay cả những tấm biển quảng cáo tại Nhật Bản cũng quan sát người đi đường, đánh giá xem họ phù hợp với hồ sơ khách hàng nào và lập tức thay đổi thông điệp hiển thị dựa trên những đánh giá đó. Những bước tiến trong công nghệ kết nối không dây cùng sự chuẩn hóa cao hơn các giao thức giao tiếp cũng giúp chúng ta thu thập dữ liệu từ các cảm biến đó gần như mọi lúc mọi
nơi. Các con chip silicon siêu nhỏ đang được tăng dung lượng, và giảm giá thành. Những bước tiến lớn trong năng lực lưu trữ và điện toán – trong đó một số đã hiện hữu dưới dạng điện toán đám mây – đã tạo điều kiện cho việc tính toán số liệu trên quy mô lớn và với chi phí giảm dần38.
Tất cả đều đang chung tay tạo nên Dữ Liệu Lớn.
GIẢI PHẪU DỮ LIỆU LỚN
Khi xem xét các kiểu và hình thức dữ liệu sẵn có, chúng ta rất dễ thấy mọi người đắm chìm trong những khả năng của Dữ Liệu Lớn và bị chúng đánh lừa. Tuy nhiên, như đã nói, tôi cho rằng thuật ngữ này rồi sẽ biến mất, và thứ hiện chúng ta xem là Dữ Liệu Lớn sẽ chỉ là “dữ liệu” trong tương lai.
Trước hết, những gì hiếm gặp và thú vị hôm nay rồi sẽ trở nên phổ biến. Thêm nữa, thuật ngữ này có thể đơn giản và dễ nhớ, nhưng lại quá đơn giản và quá nhấn mạnh vào khối lượng của dữ liệu. Thế nhưng, khối lượng (volume) chỉ là một trong bốn chữ V của Dữ Liệu Lớn:
• Khối lượng (Volume): lượng dữ liệu khổng lồ được tạo ra mỗi giây;
• Vận tốc (Velocity): tốc độ để dữ liệu mới sinh ra và lan truyền khắp thế giới. Chẳng hạn, công cụ phát hiện lừa đảo thẻ tín dụng có thể theo dấu hàng triệu giao dịch khi phát hiện khuynh hướng bất thường gần như ngay lập tức;
• Sự đa dạng (Variety): những loại dữ liệu khác nhau được tạo ra từ dữ liệu tài chính cho đến tin tức truyền thông xã hội; từ ảnh chụp cho đến dữ liệu cảm biến; từ băng video cho đến băng ghi âm giọng nói;
• Tính xác thực (Veracity): mức độ hỗn tạp của dữ liệu được tạo ra. Hãy nghĩ đến các bài đăng trên Twitter với đầy những hashtag, từ viết tắt, lỗi đánh máy, ngôn ngữ tin nhắn và lối trò chuyện thông tục.
Chúng ta không cần Dữ Liệu Lớn – chúng ta cần Dữ liệu THÔNG MINH!
Kẽ hở của Dữ Liệu Lớn
Cũng như bao kẻ tiên phong khác, những kẻ tiên phong trong Dữ Liệu Lớn cũng bị công kích. Có những người tin rằng nó chỉ là “chuyện bé xé ra to39”, rằng thuyết Dữ Liệu Lớn quá xa rời thực tế ở hầu hết các doanh nghiệp; vì nó chẳng bao giờ đem lại nhiều thành quả, nếu không muốn nói là vô ích trong phần lớn môi trường kinh doanh.
Quả thực, có một số công ty hiện đang nắm giữ những khối dữ liệu khổng lồ; tuy nhiên, hầu hết các doanh nghiệp sẽ chẳng bao giờ chạm đến được khối lượng và mức độ đa dạng của những dữ liệu mà Amazon, eBay và Facebook sở hữu. Nhưng như tôi đã nói từ trước, điều đó không thành vấn đề, vì đa số doanh nghiệp không cần phải tiếp cận cả đại dương dữ liệu.
Một đòn tấn công khác lại xoay quanh dữ liệu khách hàng và sự riêng tư.
Uy tín của Dữ Liệu Lớn từng bị tổn hại sau những tiết lộ của kẻ tố giác Edward Snowden, rằng Cơ quan An Ninh Quốc gia Mỹ (NSA) đã áp dụng phân tích Dữ Liệu Lớn một cách có hệ thống nhằm “do thám” nội dung liên lạc của tất cả mọi người, và tiến hành giám sát
có chủ ý đối với nhiều cá nhân và công ty. Chúng ta đều có thể chắc chắn rằng cơ quan chính phủ Mỹ không phải là cơ quan duy nhất chuyên thu thập và sử dụng Dữ Liệu Lớn trên thế giới. Ví dụ, ngài Bernard Kouchner, nguyên Bộ trưởng Bộ Ngoại giao Pháp đã khẳng định: “Hãy thành thật đi, chúng ta cũng nghe trộm. Tất cả mọi người đều lắng nghe những người khác nói gì. Nhưng chúng ta không có những phương tiện giống như người Mỹ, và điều đó khiến chúng ta ghen tị.”
Như tôi đã từng viết về chuyện này vào năm 2014, bất kể những tin tức truyền thông đình đám về Snowden, hầu hết mọi người vẫn hoàn toàn không ý thức được thông tin về họ đang xuất hiện rộng
rãi trên mạng. Thậm chí, nếu ai đó dành thời gian thiết lập đầy đủ chế độ cá nhân trên mạng xã hội và thận trọng, cảnh giác trước việc chia sẻ thông tin thái quá – sẽ vẫn có hiện tượng một lượng thông tin về họ bị thu thập, lưu trữ và phân tích. Ví dụ, đa số chúng ta đều hoàn toàn quên mất sự thật rằng bộ cảm biến GPS trong điện thoại có thể xác định một bức ảnh được chụp ở đâu trong khoảng cách vài mét, bất kể người chia sẻ ảnh có “tag” thêm ai đó, gửi kèm thông điệp hay chú thích. Họ không nhận ra các trang mạng xã hội của họ được công khai và tự do truy cập như thế nào, hay có bao nhiêu nội dung họ đăng được lưu lại và phân tích, ngay cả khi trang mạng thông báo với người dùng rằng ảnh chụp hoặc video sẽ tự hủy trong 10 giây. Người dùng có thể không truy cập được những hình ảnh đó sau một khoảng thời gian, nhưng chúng đã được lưu. Họ không hề biết trình duyệt web đang theo dõi từng động thái của họ, hay thậm chí người khác có thể dễ dàng xâm nhập vào máy quay, máy tính xách tay của họ và xem chúng.
Năm 2013, một sinh viên 19 tuổi người Mỹ đã bị kết tội xâm nhập vào webcam của Hoa hậu Thiếu niên Mỹ. FBI phát hiện ra cậu ta đã sử dụng một phần mềm độc hại để điều khiển webcam từ xa, hòng lấy trộm hình ảnh và video khỏa thân của ít nhất bảy phụ nữ khi họ thay quần áo. Một số là người cậu ta quen biết, còn lại là do phát hiện khi tấn công các trang Facebook của họ40. Năm 2014 tại Anh, một người khác cũng phải chịu án treo vì tội tương tự. Có lẽ tốt nhất bạn nên che webcam lại khi không sử dụng. Đề phòng vẫn hơn.
Như vậy, mọi người vẫn chưa thực sự hiểu những mối nguy hay giá trị vốn có từ dữ liệu của chính mình, và vẫn vui vẻ, thoải mái chia sẻ để đổi lại những dịch vụ mà họ mong muốn, như Facebook chẳng hạn.
Facebook đã trở thành thiên đường khai thác dữ liệu cực lớn, với những khối dữ liệu không thể tin nổi mà họ nắm trong tay. Tất cả chúng đều được người dùng Facebook hào hứng chia sẻ. Hãy nhớ lại các con số thống kê trong phần trước, 350 triệu bức ảnh mỗi ngày, 293.000 cập nhật trạng thái mỗi phút và 25% người dùng chẳng bận tâm đến quyền riêng tư.
Facebook biết chúng ta trông như thế nào, bạn bè là ai, quan điểm ra sao, sở thích là gì, khi nào đến sinh nhật, mối quan hệ của chúng ta có tốt hay không, chúng ta đang ở đâu, thích hoặc ghét điều gì... và còn hơn thế nữa. Quả là một lượng thông tin (hoặc sức mạnh) lớn khủng khiếp trong tay một công ty thương mại.
Mọi người có lẽ sẽ bắt đầu khó chịu về lượng dữ liệu mà người khác biết và lưu giữ về họ. Nhưng điều đó thực sự khác biệt đến mức nào? Hãy quay lại với Facebook: ngay cả khi chúng ta ngưng sử dụng Facebook ngay hôm nay (một điều rất bất thường), thì công ty này vẫn sẽ sở hữu nhiều thông tin về mọi người hơn bất kỳ công ty tư nhân nào khác. Google có thể gần bằng, nhưng họ không có nhiều thông tin cá nhân chi tiết như Facebook. Và tất nhiên, không chỉ có Facebook mới như thế.
Thách thức chính là một khi các công ty tiếp cận được dữ liệu, họ sẽ không dừng lại. Và chúng ta không cần phải là thành viên sở hữu thẻ khách hàng thân thiết thì mới bị họ đọc thông tin về mình: Ngoài mạng xã hội, họ còn có thể theo dấu thẻ tín dụng của chúng ta và sử dụng phần mềm nhận diện khuôn mặt để ghi lại những gì chúng ta làm trong cửa hàng.
Một nghiên cứu gần đây cho thấy chúng ta có thể dự đoán chính xác phạm vi những đặc điểm nhạy cảm cao ở cá nhân chỉ bằng cách phân tích số lượt “Thích” (Like) trên Facebook. Công trình này do các nhà nghiên cứu tại Đại học Cambridge và Microsoft Research tiến hành, cho thấy các khuynh hướng “Thích” trên Facebook có thể giúp dự đoán chính xác như thế nào đối với những đặc điểm như: khuynh hướng tính dục, mức độ hài lòng với cuộc sống, trí thông minh, sự ổn định cảm xúc, tôn giáo, mức độ lạm dụng rượu và ma túy, tình trạng quan hệ, tuổi tác, giới tính, chủng tộc và quan điểm chính trị ở nhiều người41.
Sự thật là lượng dữ liệu tổng thể mà các ngân hàng, công ty thẻ tín dụng, công ty bảo hiểm, siêu thị và truyền thông xã hội nắm giữ là cực kỳ lớn, và luôn không ngừng tăng lên.
Thậm chí, nếu số lượng người trở nên khó chịu không đủ để kéo theo những thay đổi về mặt pháp chế, thì tất cả cũng đã quá muộn. Chẳng khác nào bạn tìm cách đóng cửa chuồng khi con ngựa đã lồng lên. Chí ít thì luật pháp có thể buộc một số dữ liệu nhạy cảm nhất phải ẩn danh, chẳng hạn như loại bỏ các công cụ theo dõi nhằm xác định danh tính người thật. Nhưng chúng vẫn sẽ được sử dụng, và công cuộc dữ liệu hóa thế giới sẽ không dừng lại.
SỬ DỤNG CÁC CHỈ SỐ VÀ DỮ LIỆU NHƯ THẾ NÀO ĐỂ CÓ LỢI THẾ CHIẾN LƯỢC?
Dù chúng ta thích hay không, sẵn sàng hay không, tương lai phía trước vẫn sẽ có Dữ Liệu Lớn. Khả năng vận dụng sức mạnh đó một cách thông minh, thực tế và hợp lý sẽ giúp chúng ta biến chúng thành Dữ Liệu THÔNG MINH có ý nghĩa.
Sau khi đã bắt đầu với chiến lược và nhận diện những câu hỏi SMART xung quanh khách hàng, tài chính, hoạt động, nguồn lực và rủi ro, bạn cần tìm ra các chỉ số và dữ liệu thực sự cần tiếp cận để có câu trả lời. Chúng sẽ giúp bạn thực thi chiến lược của mình.
Xác định nhu cầu chỉ số và dữ liệu
Bước tiếp theo để trở thành một doanh nghiệp THÔNG MINH là phải xác định những dữ liệu mà bạn cần tiếp cận hoặc thu thập, từ đó trả lời những câu hỏi SMART trong chương trước.
Từ những gì bạn đã biết về dữ liệu có cấu trúc, phi cấu trúc và bán cấu trúc, cũng như dữ liệu nội bộ và bên ngoài, trước tiên, bạn cần xem xét một hệ thống phân cấp logic khi tìm cách xác định các chỉ số và dữ liệu giúp giải đáp các câu hỏi SMART của mình.
Hệ thống phân cấp này như sau:
1. Dữ liệu nội bộ có cấu trúc (đây là dữ liệu dễ tìm và dễ phân tích nhất, và có lẽ cũng ít tốn kém để sở hữu nhất);
2. Dữ liệu nội bộ bán cấu trúc;
3. Dữ liệu nội bộ phi cấu trúc;
4. Dữ liệu bên ngoài có cấu trúc;
5. Dữ liệu bên ngoài phi cấu trúc.
Nhiều doanh nhân quá tập trung đến cái đích cuối cùng là dữ liệu bên ngoài phi cấu trúc. Đây là một sai lầm. Nếu bạn có thể giải đáp các câu hỏi SMART một cách hiệu quả bằng dữ liệu nội bộ có cấu trúc, thì sao phải phí thời gian quý báu để tìm kiếm câu trả lời từ nguồn khác?
Khi đi hết quá trình này, bạn sẽ sớm nhận ra một số dữ liệu khó thu thập hơn những dữ liệu khác. Ngoài dữ liệu nội bộ, bên ngoài, phi cấu trúc và có cấu trúc, còn có bảy cách chính để thu thập dữ liệu42:
1. Dữ liệu tự tạo
2. Dữ liệu kích thích
3. Dữ liệu giao dịch
4. Dữ liệu sưu tầm
5. Dữ liệu thử nghiệm
6. Dữ liệu nắm bắt
7. Dữ liệu do người dùng tạo ra.
Tuy có thể có sự trùng lặp trong bảy nhóm kể trên, nhưng chúng cũng tạo nên một bộ khung khá tốt. Giờ hãy xem xét từng phương pháp sản sinh dữ liệu trên một cách chi tiết hơn.
1. Dữ liệu tự tạo được “tạo ra” vì chúng sẽ không tồn tại trừ khi chúng ta đặt câu hỏi cho người khác và đặt ra cơ chế thu thập câu trả lời từ họ. Ví dụ về dữ liệu tự tạo là những dữ liệu có được từ các khảo sát nghiên cứu thị trường, các nhóm khảo sát trọng điểm hoặc khảo sát nhân viên. Những người đăng ký tham gia các câu lạc bộ
hoặc chương trình khách hàng thân thiết trực tuyến cũng là ví dụ điển hình cho dữ liệu tự tạo, khi ai đó tự nguyện cung cấp thông tin về bản thân họ. Dữ liệu tự tạo thường ở dạng có cấu trúc hoặc bán cấu trúc, và có thể là dữ liệu nội bộ hoặc bên ngoài.
2. Dữ liệu kích thích mang tính “khiêu khích” vì chúng sẽ không tồn tại trừ khi bạn động viên mọi người thể hiện quan điểm của họ. Ví dụ về dữ liệu kích thích là khi bạn yêu cầu khách hàng đánh giá hoặc xếp hạng một sản phẩm hay dịch vụ. Chẳng hạn, khi mua một món hàng từ Amazon, bạn bị thôi thúc phải đánh giá cả sản phẩm lẫn công tác giao hàng thông qua một hệ thống năm sao. Một sao ngụ ý rằng bạn rất không hài lòng, còn năm sao nghĩa là bạn cực kỳ hài lòng. Dữ liệu kích thích thường ở dạng có cấu trúc hoặc bán cấu trúc, và có thể là dữ liệu nội bộ hoặc bên ngoài.
3. Dữ liệu giao dịch được tạo ra mỗi khi khách hàng mua món gì đó. Điều này áp dụng trong môi trường trực tuyến lẫn đời thực, và cung cấp những hiểu biết rất hữu ích về món hàng được mua, thời gian mua và địa điểm mua. Dữ liệu giao dịch cũng có thể làm sáng tỏ rất nhiều điều khi được kết hợp với các dữ liệu khác như thời tiết. Chẳng hạn như vài năm trước, Walmart đã từng tiến hành khám phá một số dữ liệu trong quá khứ, rồi tham chiếu chéo dữ liệu đó với dữ liệu thời tiết. Họ phát hiện ra rằng khi có cảnh báo bão, doanh số của những mặt hàng như đèn pin sẽ gia tăng. Điều này dường như nằm trong dự kiến. Tuy nhiên, điều họ không ngờ đến là giữa bánh quy Pop-Tarts 43và cơn bão cũng có mối tương quan! Walmart chẳng cần biết vì sao khách hàng lại mua thêm Pop-Tarts khi cơn bão đến gần, mà tất cả những gì họ cần làm là chất thật nhiều hộp bánh như thế trước cửa hàng để đẩy doanh số. Dữ liệu giao dịch thường là dữ liệu nội bộ có cấu trúc.
4. Dữ liệu sưu tầm được “sưu tầm” vì chúng đến từ các cơ sở dữ liệu khổng lồ mà các công ty như Experian và Axciom nắm giữ đối với từng hộ gia đình. Các công ty này sưu tầm từng khối dữ liệu cực lớn từ nhiều nguồn khác nhau, và thường dùng tên hay địa chỉ của bạn làm tiêu chí nhận diện phổ biến. Họ cung cấp một lượng thông tin phong phú cho nhiều công ty marketing nhằm khai thác lợi thế
tiếp thị thông qua điểm tín dụng, nơi ở, lịch sử mua hàng, xe được đăng ký dưới tên bạn, ngày gia hạn hợp đồng bảo hiểm... Dữ liệu sưu tầm thường là dữ liệu bên ngoài có cấu trúc.
5. Dữ liệu thử nghiệm thực ra là dạng kết hợp giữa dữ liệu tự tạo và giao dịch. Chúng liên quan đến việc xây dựng các thử nghiệm mà trong đó những khách hàng khác nhau trải qua các hình thức tiếp thị khác nhau (tự tạo) và quan sát kết quả trong đời thực (giao dịch). Đây chính là điều chúng ta chứng kiến tại các cửa hàng bán lẻ thời trang khi nghe thấy tiếng bước chân đi ngang qua, chúng ta có thể thử nghiệm nhiều cách trưng bày khác nhau ngoài cửa sổ để xem kiểu trưng bày nào thu hút được nhiều khách vào mua hàng hơn. Dữ liệu thử nghiệm thường ở dạng có cấu trúc hoặc bán cấu trúc, và có thể là dữ liệu nội bộ hoặc bên ngoài.
6. Dữ liệu nắm bắt là những thông tin được thu thập một cách thụ động từ hành vi cá nhân, chẳng hạn như các từ khóa tìm kiếm mà bạn gõ lên Google, hoặc dữ liệu về địa điểm mà điện thoại của bạn tạo ra thông qua GPS. Đây chính là kiểu dữ liệu bùng nổ do sự xuất hiện của Internet Vạn Vật. Hầu hết mọi người đều không ý thức được những dữ liệu về họ bị chiếm đoạt mà không có sự cho phép của họ. Dữ liệu nắm bắt thường ở dạng phi cấu trúc, và có thể là dữ liệu nội bộ hoặc bên ngoài.
7. Dữ liệu do người dùng tạo ra là những dữ liệu mà các cá nhân và doanh nghiệp chủ ý tạo ra, hoặc chí ít là ý thức được điều đó. Chúng bao gồm các bài đăng trên Facebook, Twitter, video đăng trên YouTube và bình luận phía dưới một bài báo hoặc blog. Đa phần dữ liệu do người dùng tạo ra thường không lập tức được quy cho một cá nhân. Ví dụ, bạn có thể biết một hashtag chứ không biết người chia sẻ nó. Chúng ta có thể dùng chúng để mở ra bối cảnh cho công tác thiết kế và truyền thông về sản phẩm, nhưng không trực tiếp nhắm đến mục tiêu nào cả. Dữ liệu do người dùng tạo ra thường ở dạng phi cấu trúc, có thể là dữ liệu nội bộ hoặc bên ngoài44.
Hãy nhớ kỹ những điều trên khi bạn cân nhắc về các nhu cầu dữ liệu đối với từng phần trong bảng chiến lược SMART.
Nhu cầu dữ liệu về khách hàng
Khi nhắc đến dữ liệu về khách hàng, sẽ có rất nhiều lựa chọn về nguồn dữ liệu với chất lượng, độ phức tạp và chi phí. Hãy xem hình 3.1 để tham khảo một số lựa chọn.
Hình 3.1. Ví dụ về dữ liệu trong phần “khách hàng”:
Tìm kiếm dữ liệu THÔNG MINH để trả lời các câu hỏi SMART: http://www.marketingprofs.com/article/2014/24670/little-data-vs-big data-nine-types-of-data-and-how-they-should-be-used
a) Dữ liệu nghiên cứu khảo sát
Bất kể được tiến hành trong nội bộ hay thông qua một bên thứ ba giàu kinh nghiệm, dữ liệu nghiên cứu khảo sát vẫn luôn đem lại kết quả đáng tin cậy. Bản chất của chúng là dữ liệu thử nghiệm và có thể cần đến thiết kế nghiên cứu, dữ liệu quy chuẩn, mô hình tính toán, kiểm soát tác nhân, kiểm soát số liệu, kinh nghiệm trong quá khứ và các tiêu chuẩn đảm bảo chất lượng. Nghiên cứu khảo sát cũng tương đối ít tốn kém45.
• Bạn có thể thiết kế một bản khảo sát để giúp trả lời các câu hỏi SMART không?
b) Dữ liệu bán hàng và giao dịch
Dữ liệu bán hàng rất hữu ích vì mọi lý do, nhưng lại hiếm khi là chỉ số chính xác đối với doanh số thực do không kể đến lợi nhuận. Đây là chỉ số phù hợp dành cho những việc đã xảy ra trong quá khứ, nhưng bạn cần kết hợp chúng với các bộ dữ liệu khác để hiểu được điều gì đã xảy ra.
• Dữ liệu bán hàng và giao dịch có giúp bạn trả lời các câu hỏi SMART không?
c) Dữ liệu theo dõi mắt người dùng
Đã có những bước tiến vững chắc trong mảng công nghệ có khả năng đánh giá những điều mà khách hàng của bạn quan tâm. Điều này đồng nghĩa bạn có thể đánh giá xem họ đang chú ý đến thứ gì và không chú ý đến thứ gì. Một số khách hàng của tôi đã áp dụng việc theo dõi mắt người dùng đối với website của họ; còn một bảo tàng lại ứng dụng công nghệ này để hiểu khách hàng ngắm nhìn những tác phẩm quan trọng trong bộ sưu tập của họ như thế nào.
• Bạn có thể tận dụng việc theo dõi mắt người dùng để trả lời các câu hỏi SMART không?
Nhu cầu dữ liệu về hoạt động
Hình 3.2. Ví dụ về dữ liệu trong phần “hoạt động”: rút ra từ các câu hỏi SMART trong bảng chiến lược SMART:
Các quy chuẩn và quy trình hoạt động của bạn sẽ tạo ra, hoặc có thể tạo ra một lượng dữ liệu khổng lồ, giúp bạn ra quyết định tốt hơn và cải thiện hiệu suất. Hình 3.2 sẽ xác định một số lựa chọn cho bạn:
a) Dữ liệu RFID
Dữ liệu RFID hiện đang được sử dụng trong sản phẩm tiêu dùng, hộ chiếu Mỹ, hàng đóng gói vận chuyển, thẻ tín dụng và thẻ ghi nợ áp dụng cách giao dịch “không tiếp xúc”. Phương thức này phụ thuộc vào các vi chip phát ra sóng vô tuyến hàm chứa những thông tin cụ thể về một sản phẩm hoặc cá nhân.
• Dữ liệu RFID có giúp bạn trả lời một số câu hỏi SMART không? b) Dữ liệu chuỗi cung ứng
Dữ liệu chuỗi cung ứng giúp các doanh nghiệp theo dõi xem sản phẩm đang ở đâu và đến từ đâu. Loại dữ liệu này đang ngày càng trở nên quan trọng trong chuỗi cung ứng thực phẩm, với mục đích đánh giá và truy tìm nguồn gốc. Hãy nhớ lại vụ bê bối thịt ngựa tại Anh vào năm 2013, khi một số chuỗi siêu thị lớn phải loại bỏ bánh kẹp thịt bò đông lạnh khỏi các cửa hàng, khi phát hiện chúng có lẫn thịt ngựa.
• Dữ liệu chuỗi cung ứng có giúp bạn trả lời một số câu hỏi SMART không?
c) Dữ liệu sinh trắc học
Các phương pháp đo lường phản ứng dẫn điện dưới da, giãn nở đồng tử mắt, nhịp tim, EEG (sóng điện não đồ) và nhận diện cảm xúc trên khuôn mặt đều thực hiện được và tượng trưng cho một lĩnh vực khám phá mới đầy thú vị, hứng khởi.
• Dữ liệu sinh trắc học có giúp bạn trả lời một số câu hỏi SMART không?
Nhu cầu dữ liệu về tài chính
Hình 3.3. Ví dụ về dữ liệu trong phần “tài chính”: rút ra từ các câu hỏi SMART của bảng chiến lược SMART:
Nếu xem mục tiêu được chú trọng nhất trong kinh doanh là kiếm ra tiền, thì yếu tố cần thiết đối với mỗi doanh nghiệp là phải hiểu được tình trạng tài chính của họ. Hình 3.3 sẽ liệt kê chi tiết một số giải pháp dữ liệu giúp xác định dữ liệu tài chính.
a) Dữ liệu giao dịch tài chính
Dữ liệu giao dịch tài chính bao gồm ngày và thời điểm diễn ra giao dịch, một bản mô tả sự việc và giá trị con số. Ví dụ, các đơn đặt
hàng, hóa đơn, phiếu thanh toán, vận chuyển, ghi chép đi lại hoặc sổ lưu trữ đều là dữ liệu giao dịch tài chính.
• Dữ liệu giao dịch tài chính sẽ giúp bạn trả lời các câu hỏi SMART chứ?
b) Dữ liệu thị trường chứng khoán
Dữ liệu thị trường chứng khoán sẽ bao gồm thông tin về giá cổ phiếu, những thay đổi và xu hướng giá cũng như vô số chỉ số phổ biến khác chuyên được dùng để đánh giá hiệu quả trên thị trường chứng khoán.
• Dữ liệu thị trường chứng khoán có giúp bạn trả lời các câu hỏi SMART không?
c) Dữ liệu dòng tiền
Nguyên nhân lớn nhất dẫn đến thất bại trong kinh doanh là thiếu dòng tiền. Do đó, dữ liệu dòng tiền sẽ cho phép doanh nghiệp giám sát lượng tiền vào và ra khỏi công ty, từ đó duy trì dòng tiền luôn trong tình trạng tích cực.
• Dữ liệu dòng tiền có giúp bạn trả lời các câu hỏi SMART của mình không?
Nhu cầu dữ liệu về nguồn lực
Hình 3.4. Ví dụ về dữ liệu trong phần “nguồn lực”: rút ra từ các câu hỏi SMART của bảng chiến lược SMART:
Phần thiết yếu đối với một doanh nghiệp SMART là phải biết được bạn đang có những nguồn lực nào và tìm cách tận dụng chúng sao cho hiệu quả nhất. Khi cần tìm dữ liệu về các nguồn lực, hãy tham khảo hình 3.4 để được gợi ý về một số lựa chọn phổ biến nhất.
a) Dữ liệu phỏng vấn
Ta có thể thu thập dữ liệu phỏng vấn dưới hình thức định tính lẫn định lượng. Định lượng nghĩa là tập hợp các dữ liệu bao gồm số liệu và những phản hồi xếp loại có cấu trúc. Định tính tức là tập hợp các dữ liệu không ở dưới dạng con số như phản hồi bằng văn bản, câu trả lời cho các câu hỏi mở, các nhận xét hoặc ghi chép... Dữ liệu phỏng vấn là cách phổ biến để thu thập phản hồi từ nguồn lực quan trọng nhất của bạn – nhân sự trong doanh nghiệp.
• Dữ liệu phỏng vấn có giúp bạn trả lời các câu hỏi SMART của mình không?
b) Dữ liệu tự đánh giá hiệu suất
Đúng như tên gọi, loại dữ liệu này sẽ cho biết một người tự nhìn nhận hiệu suất làm việc của họ ra sao, hay cảm thấy thích một sản phẩm đến mức nào – nhưng dưới hình thức tự đánh giá thay vì phỏng vấn tương tác.
• Dữ liệu tự đánh giá hiệu suất có giúp bạn trả lời các câu hỏi SMART của mình không?
c) Dữ liệu tuyển dụng
Dữ liệu tuyển dụng do bộ phận nhân sự nắm giữ và có thể cho bạn biết công tác tuyển dụng thành công hay thất bại ra sao? Tỷ lệ vắng mặt trong doanh nghiệp là gì? Và cả về tỷ lệ nhân viên thôi việc, chi phí đào tạo và số ngày nghỉ ốm? Tất cả đều là dữ liệu tuyển dụng.
• Bộ phận nhân sự hoặc dữ liệu tuyển dụng có thể giúp bạn trả lời những câu hỏi SMART của mình không?
d) Dữ liệu cảm biến và máy móc
Nhiều loại máy móc và hệ thống IT có các bộ cảm biến bên trong cùng khả năng thu thập dữ liệu, giúp chúng tạo ra từng khối lượng dữ liệu lớn về hiệu quả hoạt động thực tế, phát hiện lỗi, tận dụng công năng và nhiều vai trò khác.
"""