SEO ON - Page Trong Tầm Tay

🔙 Quay lại trang tải sách pdf ebook SEO ON - Page Trong Tầm Tay - Trình Nguyễn Ebooks Nhóm Zalo SEO ON-PAGE - TRONG TẦM TAY Trình Nguyễn NHÀ XUẤT BẢN THẾ GIỚI Trụ sở chính: Số 46, Trần Hưng Đạo, Hoàn Kiếm, Hà Nội Tel: 0084.4.38253841 – Fax: 0084.4.38269578 Chi nhánh: Số 7, Nguyễn Thị Minh Khai. Quận 1, TP. Hồ Chí Minh Tel: 0084.8.38220102 Email: [email protected] Website: www.thegioipublishers.vn Chịu trách nhiệm xuất bản: GIÁM ĐỐC – TỔNG BIÊN TẬP TS. TRẦN ĐOÀN LÂM Biên tập: Trịnh Hồng Hạnh Sửa bản in: Huyền My Thiết kế bìa: Nhật Anh Trình bày: Vũ Lê Thư In 3.000 bản, khổ 16 x 24 cm tại Công ty Cổ phần In Sách Việt Nam (INSAVINA) Địa chỉ: 22B Hai Bà Trưng, quận Hoàn Kiếm, TP. Hà Nội. Số ĐKXB: 422-2021/CXBIPH/07-28/ThG Quyết định xuất bản số: 176/QĐ-ThG cấp ngày 26 tháng 02 năm 2021 ISBN: 978-604-77-9178-1. In xong và nộp lưu chiểu năm 2021. Ổ Ầ CÔNG TY CỔ PHẦN SÁCH ALPHA www.alphabooks.vn VP HN: Tầng 3, Dream Center Home, số 11A, ngõ 282 Nguyễn Huy Tưởng, Phường Thanh Xuân Trung, Quận Thanh Xuân, TP. Hà Nội Tel: (84-24) 3 722 62 34 | Fax: (84-24) 3 722 62 37 Chi nhánh TP. HCM: 138C Nguyễn Đình Chiểu, Phường 6, Quận 3, TP. Hồ Chí Minh Tel: (84-28) 38220 334 | 35 LỜI GIỚI THIỆU TÂN NGUYỄN Digital Marketing Trainer tại Tandigi Vice Diretor tại FoogleSEO – Dịch vụ và Đào tạo Digital Marketing Head of Division DIGITAL tại Hướng nghiệp Á Âu C uốn sách này sẽ dành cho bạn, nếu: • Bạn là người dùng Internet, cũng như sử dụng Google Tìm kiếm (Google Search) hằng ngày và luôn tự hỏi: “Làm thế nào để hiện diện trên Google?” • Bạn là một chủ doanh nghiệp và đang mong muốn website của công ty mình được hiển thị bền vững trên trang chủ của Google. • Bạn là một người làm marketing và đang mong muốn thu hút được nhiều lưu lượng dữ liệu hơn cho chiến dịch của mình. • Bạn là một người làm marketing liên kết và đang mong muốn thu hút được nhiều lượt click hơn trên trang web của mình. Hiểu được nguyên lý hoạt động của công cụ tìm kiếm Google đã khó, tối ưu hóa được kết quả tìm kiếm để tạo ra lợi thế cạnh tranh trên chiến trường Internet còn khó hơn rất nhiều. Cho dù bạn liên tục tham gia các khóa học, thuê nhiều chuyên gia tư vấn... để triển khai chiến dịch nhưng kết quả vẫn không mấy khả quan. SEO ON-PAGE trong tầm tay là một bộ công cụ hoàn thiện cung cấp cho độc giả giải pháp tối ưu hóa SEO On-Page thông qua p ộ g g p p g g q kinh nghiệm được tích lũy nhiều năm và nhiều dự án thành công. Tác giả Trình Nguyễn đã chia sẻ kinh nghiệm, sự khôn ngoan và sự tận tâm khi đưa ra những chỉ dẫn tỉ mỉ, từng chút một để quy trình tối ưu hóa SEO vốn phức tạp trở nên dễ hiểu và dễ áp dụng hơn. Cuốn sách này có thể được coi là cẩm nang thực hành nguyên bản và độc nhất dành cho tất cả những ai đang muốn làm chủ công cụ hiệu quả nhất và lớn nhất – Internet. Xin trân trọng giới thiệu. LỜI NÓI ĐẦU L à một SEOer1, bạn sẽ thấy khó khăn khi tìm kiếm những phương pháp hữu ích và những hướng dẫn cụ thể về cách làm SEO On- page hoặc SEO Technical. 1. SEOer: Là một người thực hiện công việc SEO web (tối ưu hóa website) cho khách hàng để trang web của khách hàng luôn nằm trên danh sách đứng đầu của các công cụ tìm kiếm như: Google – Bing – Yahoo. (BTV) Cuốn sách này được tổng hợp và hệ thống hóa từ những kinh nghiệm lâu năm với mục đích mang đến cho bạn những kỹ thuật mới, độc đáo mà bạn có thể thực hiện ngay để mang lại kết quả nhanh chóng. Google thường xuyên thay đổi, không phải tất cả kỹ thuật được giới thiệu sẽ phù hợp với những đổi mới trong tương lai, nhưng chúng vẫn sẽ giữ nguyên giá trị, cũng như tính ổn định để bạn có thể áp dụng cho website của mình. Google là một thuật toán, chúng ta có thể kiểm tra, quan sát, dự đoán những gì sẽ xảy ra trong nó, nhằm thấy được quá trình đạt được thứ hạng cao bằng cách hiển thị những gì nó thích. Đó là tư duy cũng như phương pháp làm SEO khoa học và hiệu quả! Cuốn sách này chủ yếu tập trung vào những vấn đề mà các SEOer đã bỏ qua trong nhiều năm. Bên cạnh đó, sẽ có giải đáp về một số vấn đề mà chúng ta đang phải đối mặt trong bối cảnh hiện tại, chẳng hạn như xu hướng tìm kiếm bằng giọng nói (Voice Seach) hay “vị trí 0” trên SERP (Search Engine Results Page), xử lý ngôn ngữ tự nhiên NLP (Natural Language Processing). g Cuốn sách này phù hợp với các SEOer ở mọi giai đoạn và mọi trình độ, bạn sẽ có được nhiều lời khuyên cùng những kiến thức hữu ích để bổ sung và tích hợp vào chiến lược SEO, từ đó tạo ra những kết quả đột phá cho website và doanh nghiệp của mình. #1 TỪ KHÓA (KEYWORD) – RẤT QUEN THUỘC NHƯNG ÍT NGƯỜI HIỂU ĐÚNG T ừ khóa (Keyword) là gì? • Từ khóa là một từ hoặc cụm từ được người dùng gõ trong Google Search. Để hiển thị được trong Google, từ khóa cần có đủ hai yếu tố: • Relevance (mức độ phù hợp) • Rank (điểm thứ hạng, điểm xếp hạng) Làm thế nào để xác định mức độ phù hợp và điểm xếp hạng? • Google nhìn vào những vùng, khu vực tín hiệu trên trang. • Nơi từ khóa được đặt. • Tần suất xuất hiện trên trang. Cuối cùng, từ khóa nên được đặt ở đâu trên trang? • Một chủ đề một trang (Google muốn có một sự đối ứng 1-1 để trả lời tốt nhất câu hỏi của người dùng). • Google lập chỉ mục và xếp hạng các trang, bạn phải chỉ định một trang cụ thể cho một từ khóa chính, những từ khóa phụ đi theo từ khóa chính. #2 Ý ĐỊNH TÌM KIẾM (SEARCH INTENT) – CÁCH NHẬN DIỆN Ý ĐỊNH TÌM KIẾM N gười dùng có nhiều ý định tìm kiếm khác nhau, tùy theo mục đích và nhu cầu. Sau đây là bốn nhóm ý định chính: BỐN NHÓM Ý ĐỊNH CHÍNH 1. Ý định tìm kiếm thông tin (Informational) Với ý định này, người dùng đang muốn tìm kiếm thông tin về một vấn đề nào đó, có thể là câu trả lời cho một câu hỏi đơn giản như “Tổng thống Mỹ là ai?”, hoặc một nội dung nào đó dài hơn, chuyên sâu hơn như “Blockchain hoạt động như thế nào?”. Tuy nhiên, không phải mọi truy vấn tìm kiếm thông tin đều được trình bày dưới dạng câu hỏi. Ví dụ: • Giá xe LX570 • Đường đi đến sân bay Tân Sơn Nhất 2. Ý định điều hướng (Navigational) Với ý định này, người dùng đang muốn tìm kiếm một địa chỉ trang web cụ thể. Họ đã biết được mình muốn truy cập vào đâu. Việc gõ vào Google để tìm kiếm sẽ nhanh và thuận tiện cho họ hơn so với việc phải nhập toàn bộ địa chỉ URL vào trong thanh địa chỉ trên trình duyệt web. Hoặc có thể họ chưa chắc chắn về địa chỉ URL chính xác của trang web đó. Ví dụ: • “FOOGLESEO” (đi đến trang foogleseo.com) • “ahrefs content explorer” (đi đến mục “Content Explorer” trong Ahrefs) • “beginners guide to SEO moz” (đi đến bài viết “Beginners Guide to SEO” trên trang Moz) 3. Ý định điều tra thương mại (Commercial Investigation) Người dùng có nhiều lựa chọn trong thị trường của một sản phẩm/dịch vụ cụ thể nhưng vẫn chưa đưa ra quyết định cuối cùng xem giải pháp nào là phù hợp nhất. Đối với những truy vấn này, họ vẫn đang cân nhắc và gần như sẽ tìm kiếm các bài đánh giá, so sánh giữa các lựa chọn với nhau. Ví dụ: • “Top 10 trung tâm đào tạo SEO” • “Những quán phở ngon nhất Hà Thành” • “Đánh giá xe Audi Q7 2020” Ngoài ra, ví dụ này còn cho thấy nhiều tìm kiếm liên quan đến địa điểm (local search) thường sẽ có ý định thuộc nhóm điều tra thương mại này. Những ví dụ khác có thể kể đến như “trạm xăng gần đây”,“khách sạn 5 sao rẻ nhất Phú Quốc”... 4. Ý định giao dịch (Transactional) Người dùng đang tìm kiếm để thực hiện hành vi mua hàng hay nói cách khác, họ đang trong trạng thái sẵn sàng thực hiện hành vi mua. Hầu như họ đều đã biết mình muốn mua những gì và đang tìm kiếm địa chỉ để mua sản phẩm/dịch vụ đó. Ví dụ: • “Mua Macbook Pro” • “Coupon giảm giá Alpha Books” • “Điện thoại Samsung Galaxy S20 giá rẻ” • “Giá của gói Bảo hiểm Nhân thọ AIA” CÁCH NHẬN DIỆN CÁC Ý ĐỊNH Những từ ngữ trong truy vấn thường giúp chúng ta hình dung được ý định khá rõ ràng. Ví dụ, đối với từ khóa “mua tai nghe bluetooth”, người dùng đang thực hiện tìm kiếm để tìm mua một sản phẩm tai nghe bluetooth nào đó (ý định liên quan đến việc mua – bán). Mặt khác, đối với từ khóa “cách thắt cà vạt”, người dùng đang tìm kiếm câu trả lời cho một vấn đề cụ thể (ý định tìm kiếm thông tin). Dưới đây là bảng tổng hợp một số từ ngữ đặc trưng (định từ – modifier words) để phản ánh một loại ý định tìm kiếm nhất định. Nếu bạn đang sử dụng một công cụ nghiên cứu từ khóa, chẳng hạn như Ahrefs, bạn có thể sử dụng những định từ này để lọc ra những từ khóa với ý định cụ thể khi thực hiện nghiên cứu từ khóa. Vì vậy, giả sử bạn đang tìm kiếm một vài từ khóa cho những bài viết blog. Đầu tiên, hãy truy cập vào “Keyword Explorer” trong công cụ Ahrefs → Nhập vào một số từ khóa chính (seed keyword) → Nhấn tìm kiếm và chọn một trong số các tùy chọn trên thanh menu bên trái để khám phá những ý tưởng từ khóa tiềm năng. Bạn nên bắt đầu với mục “Having same terms”. Tiếp theo, hãy sao chép và dán lại những định từ vào trong khung “Include” và nhấp chọn “Any word”. Bây giờ, bạn sẽ chỉ nhìn thấy những từ khóa có chứa một hoặc nhiều hơn những định từ này. Bạn có thể thực hiện những thao tác tương tự khi tìm kiếm các từ khóa có ý định giao dịch, điều tra thương mại hoặc điều hướng. #3 PHỄU BÁN HÀNG/TÌM KIẾM (SALES/SEARCH FUNNEL) K hi người dùng tìm kiếm trên Google, họ đang ở trong nhiều giai đoạn khác nhau và thực hiện nhiều loại truy vấn khác nhau. Việc của bạn là phải tối ưu trang theo từng mục đích để đáp ứng tối đa cho ý định của họ. Dưới đây là mô hình phễu đặc trưng cho hành trình bán hàng/tìm kiếm của người dùng. Giả sử người dùng tìm kiếm trên Google và truy cập vào trang của bạn. Khi đó, Google muốn nhìn thấy một mối quan hệ, một sự đối ứng phù hợp nhất, tức là sau khi vào trang của bạn, người dùng sẽ không tiếp tục tìm kiếm về vấn đề đó nữa. Nếu người dùng tiếp tục di chuyển sang những trang khác trên cùng một trang web của bạn, điều đó vẫn không sao. Nhưng nếu họ nhấp quay trở lại từ trang đó, nó sẽ bị giảm đi sức mạnh. Và nếu họ tiếp tục nhấp quay về Google từ trang của bạn để tìm kiếm thêm những kết quả khác thì trang này càng bị suy yếu, bởi đây có thể là một tín hiệu tiêu cực từ người dùng cho thấy bạn chưa đáp ứng được cho họ. Bất kể giai đoạn nào trong hành trình bán hàng/tìm kiếm, trang của bạn cũng sẽ cần có lưu lượng truy cập (traffic), hay chính xác hơn là những lượt click phản ánh sự hài lòng từ phía người dùng (happy click). Và miễn là họ vẫn ở trong trang của bạn, không thoát trang để quay trở lại Google, bạn sẽ nhận được một lượng sức mạnh để thúc đẩy thứ hạng cho trang. Sẽ có những trường hợp người dùng muốn tìm hiểu thông tin trên nhiều trang khác nhau để có được câu trả lời đầy đủ và toàn diện nhất. Khi đó, trang cuối cùng mà người dùng truy cập và không thoát ra để quay trở lại Google (tìm kiếm đã kết thúc tại đó) sẽ nhận được sức mạnh thúc đẩy, còn tất cả những trang mà người dùng đã ghé qua trước đó đều sẽ bị suy giảm sức mạnh. #4 ON-PAGE RANKING O n-Page Ranking gồm năm thành phần: • Vị trí đặt từ khóa chính • Từ khóa Entities • Từ khóa biến thể (Variations) • Từ khóa lập chỉ mục cho ngữ nghĩa tiềm ẩn (Latent Semantic Indexing – LSI/Contextual Terms) • Số từ (Word Count) #5 ON-PAGE (NLP & VECTOR) N ăm 2020, Google đã nâng cấp công nghệ trí tuệ nhân tạo (AI). Bộ máy tìm kiếm hiện nay rất hiệu quả trong việc đưa ra những nội dung phù hợp, đồng thời cũng hạn chế và “kìm hãm” các nội dung spam, thao túng SEO hoặc tối ưu hóa quá liều (over optimization). Để được xếp hạng cao hơn, bạn cần phải có hướng đi đúng đắn khác biệt – bằng cách cộng hưởng với yếu tố “vector”, với mẫu hình (pattern) mà hệ thống đang phân loại và mẫu hình của những nội dung đang được nhiều người dùng nhấp vào (đáp ứng mong đợi của họ). Ở đây có hai cơ chế là “phân loại” và “nhấp vào”. Đây là hai hệ thống tách biệt với nhau – một là Bộ máy Ngữ nghĩa (Semantic Engine) với vai trò phân loại, chấm điểm, xếp hạng cho nội dung và một là Bộ máy Đánh giá chất lượng (Quality Engine) với vai trò xác minh cho các lượt click vào những nội dung đó, đồng thời xác minh cho Bộ máy Ngữ nghĩa. Nếu không đáp ứng được cả hai bộ máy này, bạn sẽ không thể có thứ hạng cao. ☑ Bộ máy ngữ nghĩa có xu hướng vận hành dựa trên một hệ thống bao gồm hai cơ chế lập chỉ mục (index) hay hai cơ chế phân loại (sort). ☑ Quy trình: + Hệ thống tìm thấy các trang (page) và đánh dấu lại để thu thập dữ liệu (crawling). + Trang của bạn có thể được tìm thấy nhưng không được thu thập dữ liệu, ví dụ như nếu hệ thống phân loại nó là trang spam. + Hệ thống thu thập dữ liệu các trang và đánh dấu lại để lập chỉ mục. Trang của bạn có thể được tìm thấy, thu thập dữ liệu nhưng không được lập chỉ mục vì một vấn đề nào đó, chẳng hạn như nội dung trùng lặp (duplicate content). Lúc này, trang vẫn tồn tại trong danh mục chỉ mục phụ (supplemental index) nhưng không nằm trong danh mục chỉ mục chính (main index). Để có thể xử lý số lượng trang khổng lồ trên Internet, Google lưu trữ các trang vào hai cơ sở dữ liệu. Một là danh mục chỉ mục chính, còn lại là danh mục chỉ mục phụ. Chỉ có danh mục chỉ mục chính được sử dụng để lựa chọn các kết quả trả về cho mỗi truy vấn tìm kiếm. Còn danh mục chỉ mục phụ sẽ lưu trữ tất cả các trang còn lại bao gồm những trang có nội dung trùng lặp hoặc không tương tích/ phù hợp với tìm kiếm của người dùng. Hệ thống lập chỉ mục các trang và đánh dấu lại để xếp hạng một trang nhanh hoặc chậm (dựa trên chất lượng/mức độ tin cậy hiện tại của trang web từ bộ máy chất lượng và thậm chí là mức độ tin cậy của trang, chủ đề của trang đó từ Bộ máy Ngữ nghĩa). Sandbox1 tồn tại và được xếp hạng nhanh hay chậm sẽ phụ thuộc vào mức độ tin cậy hiện tại mà hệ thống dành cho trang web, dựa trên điểm số chất lượng (quality score), cũng như mức độ tiệm cận giữa nội dung của trang so với giả định của Bộ máy Ngữ nghĩa. Ngoài ra, đây cũng là một dấu hiệu cho thấy trang của bạn có được tin cậy nhiều hay không, thể hiện qua việc nó có được xếp hạng nhanh chóng hay không. 1. Sandbox xảy ra khi bạn thực hiện SEO cho một site mới hay từ khóa mới để hạn chế spam và thao túng. Google sẽ “kìm hãm” không cho trang của bạn xuất hiện trên SERP cho tới khi đủ tin cậy. Trong Google Search Console, nếu đồ thị biểu diễn kết quả về thứ hạng (đường màu cam) của trang có những chấm và khoảng ngắt như hình trên thì đó là dấu hiệu cho thấy trang đang có vấn đề về độ tin cậy hoặc chất lượng. Bạn cần phải cải thiện tỷ lệ nhấp (CTR), tối hóa ưu tỷ lệ chuyển đổi (CRO) và có thể là cả nội dung của trang. Đối với một trang web mới, chắc chắn là nó sẽ không nhận được nhiều sự tin tưởng từ Google, nhưng bạn hoàn toàn có thể làm cho trang web của mình thăng hạng nhanh chóng nhất với ít tài nguyên nhất nếu thực hiện đúng đắn các công việc cần thiết và theo một trình tự chính xác. Thuật toán chính của Google hiện nay không còn tập trung nhiều vào yếu tố “LINK” nữa, thay vào đó, những yếu tố có sự tác động mạnh mẽ sẽ là “TRAFFIC” và “ONPAGE” (cụ thể là NLP và Vector). CƠ CHẾ ĐÁNH GIÁ (SCORE) VÀ XẾP HẠNG (RANK) DIỄN RA NHƯ THẾ NÀO? Như đã đề cập ở trên: “Bộ máy Ngữ nghĩa có xu hướng vận hành dựa trên một hệ thống bao gồm hai cơ chế lập chỉ mục hay hai cơ chế phân loại.” 1. Cơ chế phân loại đầu tiên (sort 1) Mọi truy vấn tìm kiếm gửi đến Google đều được trả về khoảng 200 trang kết quả đầu tiên (tương ứng với 10 trang SERP) đã được xác định hay phân loại dựa trên cơ sở đánh giá – bởi bộ xử lý ngôn ngữ tự nhiên NLP; và thứ hạng sẽ được tổng hợp bởi mức độ trùng khớp với Vector, cùng với tất cả các thuật toán khác đã được áp dụng từ trước đến nay, bao gồm các thuật toán về liên kết (link), đánh giá chất lượng (quality), các thuật toán bộ lọc để “lọc” ra các kết quả phù hợp (filter), các hình phạt (penalty). Vai trò của NLP và Vector rất quan trọng trong cơ chế này. “Thực thể” ở đây là các đối tượng, sự vật, khái niệm mà một trang trình bày. Công nghệ NLP cùng với trí tuệ nhân tạo AI sẽ đánh giá xem một trang đang nói về chủ đề nào nhiều nhất và phân loại nó. Tiếp theo, Vector sẽ phản ánh mức độ thể hiện của trang đó với thực thể đang được nói đến, mức độ tiệm cận (độ trùng khớp) của trang này so với các trang khác cũng đang nói về chủ đề đó. 2. Cơ chế phân loại thứ hai (sort 2) Sau đó, các trang ở trên sẽ được phân loại một lần nữa và sắp xếp lại thứ hạng trước khi trả về kết quả cuối cùng cho người dùng. Cơ chế phân loại thứ hai này sẽ dựa trên: 1. Các thuật toán “QDD/QDF” để các truy vấn có được kết quả tìm kiếm đa dạng (QDD) và mới nhất (QDF). QDD = Query Deserves Diversity: Một trong những thuật toán xếp hạng của Google, đề cao yếu tố “đa dạng” (diversity). Thuật toán này cố gắng đáp ứng được ý định của người dùng bằng cách hiển thị các kết quả đa dạng với mức độ đối sánh rộng hơn (broader match). Google theo dõi hành vi của người dùng và nhận diện các mẫu hình tìm kiếm (search pattern) khi người dùng không tìm được các kết quả phù hợp, chẳng hạn như người dùng từ bỏ không tìm kiếm nữa, thử một truy vấn khác mà không nhấp vào kết quả nào hoặc liên tục rời đi (bounce) từ trang này đến trang khác. QDF = Query Deserves Freshness: Một trong những thuật toán xếp hạng của Google, đề cao yếu tố “độ tươi mới” (freshness). Thuật toán này tập trung vào việc phân phối những nội dung mới nhất đối với một số truy vấn nhất định, bao gồm những xu hướng và tin tức mới nhất, những chủ đề “nóng” hay những sự kiện diễn ra lặp lại và được xác định dựa trên số lượng tìm kiếm tăng đột biến. 2. Ngoài ra, một số thuật toán khác cũng ảnh hưởng đến bước này bao gồm: thuật toán về vị trí địa lý (geolocation), thuật toán cá nhân hóa (personalization), các thuật toán ảnh hưởng đến Local Map Pack cùng những thuật toán mới có liên quan đến Bộ máy Đánh giá chất lượng như traffic, CTR, CRO... Ở những nội dung đầu tiên này, chúng ta sẽ tìm hiểu về cách tối ưu hóa cho các trang để đáp ứng Bộ máy Ngữ nghĩa. Hãy nhớ rằng Google đánh giá và xếp hạng cho các trang, không phải cho site. Vì vậy, một site với chỉ một page cũng có thể được xếp hạng cao! Tuy nhiên tồn tại các đơn vị phân loại ở cấp độ site (site-based classifier). Một “classifier” là một bộ xử lý áp dụng công nghệ AI để thực hiện các phân tích về nội dung và “phân loại” cho nội dung đó. Phần lớn các đơn vị phân loại hiện nay đều được xây dựng trên nền tảng xử lý ngôn ngữ tự nhiên (NLP). Ngoài ra, các “classifier” cũ trước đây có thể vẫn còn hoạt động (cơ chế của chúng khá đơn giản, chẳng hạn như trang có “.com” sẽ được xếp hạng tốt hơn). Các đơn vị phân loại ở cấp độ site sẽ xác định một site nói về một chủ đề nào đó, có đáng tin cậy/có chất lượng hay không (dựa trên mẫu hình về lượt click – click pattern, phản ánh mức ự ợ p p độ thỏa mãn ý định của người dùng), mức độ liên quan về mặt địa lý đối với một khu vực (geographic relevance) để xếp hạng trên Map Pack, hay có thể kích hoạt các tính năng đặc biệt trên SERP (chẳng hạn như trích dẫn nổi bật – featured snippet) hoặc không. Có khoảng 20 đơn vị phân loại ở cấp độ trang web như thế. Ngoài ra còn có các đơn vị phân loại cho cụm trang (page cluster classifier) như rel= “next”/“prev”1, các SILO... 1. rel= “next” và rel= “prev” là các thuộc tính của một liên kết (link attributes) chỉ ra mối quan hệ giữa một chuỗi các trang với nhau cho máy tìm kiếm. Nhưng chúng ta không cần quan tâm đến các yếu tố phân loại này vì nhiệm vụ của chúng chỉ là “phân loại”. Các “classifier” này đóng vai trò như những bộ lọc và kết hợp cùng với các YẾU TỐ XẾP HẠNG ở cấp độ trang để quyết định thứ hạng cho trang (không phải site). Do vậy, việc cần làm đó là xây dựng trang một cách tối ưu, giữ cho mọi thứ được mạch lạc và đơn giản để Google có thể dễ dàng xác định xem trang của bạn nói về vấn đề gì, với mức độ cụ thể ra sao. Thậm chí trang vẫn có thể được xếp hạng tốt mà không có bất kỳ liên kết nào (link) hoặc nằm trên một trang web nói về một chủ đề khác. XÂY DỰNG VECTOR (TỐI ƯU ON-PAGE CHO HAI CƠ CHẾ PHÂN LOẠI) Hoạt động SEO On-page đã có sự thay đổi lớn, không còn xoay quanh EMQ (Exact Match Query – truy vấn trùng khớp chính xác) hay PMQ (Partial Match Query – truy vấn trùng khớp một phần) nữa. Nói cách khác,“từ khóa” hiện nay không còn quan trọng, hoặc ít nhất là không còn nắm giữ nhiều trọng số như trước đây. g g ọ g y 1. Google đang sử dụng một bộ máy xử lý ngữ nghĩa mới • Áp dụng công nghệ xử lý ngôn ngữ tự nhiên NLP để phân tích, xử lý về ngữ pháp, bối cảnh ngữ nghĩa của trang, từ đó đánh giá/nhận diện/phân loại các đối tượng thực thể trên trang, chủ ngữ, vị ngữ của câu và theo đó là xác định xem trang đang nói về chủ đề gì. NLP này có sự tương đồng với công cụ NLP API mà Google cung cấp nhưng chúng không hoàn toàn giống nhau và có thể cũng không chia sẻ chung một cơ sở dữ liệu (database). • Áp dụng cơ chế phân tích Vector, đối sánh với các tổ hợp từ ngữ tiêu biểu (collocation) hay cách diễn đạt mà những trang khác trên Internet đang sử dụng để nói về một chủ đề cụ thể để so sánh xem trang của bạn thể hiện về chủ đề đó (hay “trùng khớp”) ở mức độ nào. Nếu bạn có thể trình bày nội dung về một chủ đề theo một cách đúng đắn và áp dụng đúng cách thức diễn đạt (cụ thể là các từ và cụm từ) mà những trang khác áp dụng cho chủ đề đó, các máy tìm kiếm có thể dễ dàng hiểu được bạn đang muốn nói đến điều gì, từ đó giúp nâng cao thứ hạng. Hai thuật toán về NLP và Vector này sẽ được kết hợp cùng với nhau để đưa ra mức đánh giá, làm cơ sở cho việc quyết định xếp hạng của trang. Quá trình xử lý ngôn ngữ tự nhiên NLP bắt đầu từ các thành phần ở đầu trang như địa chỉ URL, tiêu đề Title và xuống đến phần nội dung với các thẻ H1-H6 hoặc những câu chủ đề (topic sentence) để đánh giá cũng như xác định khả năng (%) mà một trang nói về chủ đề X nào đó. Và Vector sẽ được áp dụng để đối sánh với các cụm collocation được hình thành từ các từ đơn (single word) trùng khớp trong nội dung, chủ yếu từ phần thân (body) trở xuống (ngoài ra, Vector còn có thể được đặt vào một thành phần có tên gọi là “aspect” trong Title.) Vector sẽ xác định xem nội dung của bạn thể hiện bao nhiêu (%) về chủ đề X, hay mức độ mà nội dung của trang “tiệm cận” với chủ đề đó. Trang của bạn có thể được tối ưu cho NLP nhưng không tốt cho Vector. Bộ máy tìm kiếm có thể biết rõ rằng trang của bạn nói về một chủ đề X nào đó (thể hiện qua URL, Title, thẻ H1...). Bạn có thể đạt được mức 99% cho biết rằng trang nói về chủ đề gì, hay chính xác hơn là thực thể của trang nói về chủ đề gì. Nhưng nếu ở phần nội dung trong trang lại nói về một chủ đề khác (làm “chệch hướng” Vector sang một chủ đề khác) thì mức độ thể hiện (%) về chủ đề X của trang sẽ không được đánh giá cao. Ngoài NLP và Vector, Bộ máy Đánh giá chất lượng cũng sẽ kết hợp cùng hai thuật toán trên để giúp hoàn thiện toàn bộ quy trình này, thể hiện qua những lượt click khi trang được người dùng nhấp vào (là những lượt click khi người dùng cảm thấy trang có thể đáp ứng được truy vấn tìm kiếm của họ). Và điểm giao trong hình phía trên (biểu tượng ngôi sao) sẽ là vị trí mà trang của bạn cần hướng đến. Bạn muốn trang của mình đáp ứng NLP một cách tối ưu, xây dựng được Vector hướng về chủ đề một cách tốt nhất và nhận được số lượng click nhiều nhất có thể. Quá trình xử lý NLP sẽ được áp dụng trong cơ chế phân loại 1 đã được trình bày ở nội dung trước. Và Vector sẽ được áp dụng trong cả cơ chế phân loại 1 và 2. Sau khi chỉ mục, hệ thống có thể tiến hành phân loại trang trong vòng vài giờ. Và sau đó, Bộ máy Đánh giá chất lượng sẽ mất vài ngày để xử lý, tùy thuộc vào số lượt click mà bạn nhận được, những tìm kiếm đó là gì, lượng truy cập trực tiếp là bao nhiêu, lượt hiển thị là bao nhiêu, tăng giảm thế nào, tỷ lệ CTR của các lượt click ra sao... Tóm lại, NLP thường sẽ nhìn vào những vị trí quan trọng đối với một trang, bao gồm: • Địa chỉ URL • Tiêu đề • Các thẻ H (H1-H6) • Câu chủ đề (topic sentence, giới thiệu chủ đề được trình bày trong một đoạn văn nào đó) Một điều nữa cần lưu ý, đó là: phải nhất quán giữa các tín hiệu. Chẳng hạn như địa chỉ URL thể hiện bạn đang nói đến “X” nhưng trong thẻ H2 lại nói đến “Y”, lúc này hệ thống sẽ không xử lý hiệu quả vì có hai thực thể khác nhau. Do đó bạn cần phải có sự đồng nhất tại tất cả những vị trí quan trọng hỗ trợ cho NLP xử lý và hiểu được trang của bạn đang muốn nói đến điều gì; và Vector sẽ cho biết rằng trang của bạn có liên quan cũng như thể hiện về nội dung đó ở mức độ nào. Hãy nhớ rằng: Google muốn xây dựng một hệ thống đối ứng 1:1 – mỗi câu hỏi/ truy vấn của người dung sẽ tương ứng với một câu trả lời hoàn hảo (là page topic hay chủ đề của trang). Để xếp hạng, hãy xây dựng và phản ánh các vector trong nội dung của mình để truyền đi tín hiệu cho máy tìm kiếm biết được chúng ta đang muốn đề cập đến điều gì trên trang. Khi người dùng nhập vào truy vấn tìm kiếm về X, Google muốn biết được trang nào nói về X, nói về X ở mức độ nào và đáp ứng/thỏa mãn nhu cầu tìm kiếm của người dùng về chủ đề X tốt ra sao. Sau cùng thì, Bộ máy Đánh giá chất lượng sẽ là bộ máy “chủ lực” vì nó có vai trò xác minh cho những kết quả của Bộ máy Ngữ nghĩa. 2. Hiểu thêm về NLP & Vector Có một điểm quan trọng cần lưu ý: NLP hoạt động dựa trên cụm từ (phrase-based) trong khi Vector hoạt động dựa trên các từ đơn (single-word-based). Để hiểu rõ hơn về điều này, chúng ta sẽ cùng phân tích một ví dụ. Giả sử chúng ta có một từ khóa là “best mattress topper”. NLP sẽ nhìn vào tiêu đề trên trang, cụ thể hơn là cả câu trong tiêu đề đó, chẳng hạn như: “Best mattress topper: Sale on now” NLP sẽ đọc qua toàn bộ câu và tất cả các cụm từ có trong câu đó. Và nó sẽ tiến hành nhận diện đối tượng thực thể bằng công nghệ xử lý ngôn ngữ tự nhiên. Quá trình xử lý này có thể được mô phỏng lại bằng cách thao tác với công cụ Natural Language API của Google. Bạn có thể truy cập tại địa chỉ: https://cloud.google.com/natural-language Nhập tiêu đề mà chúng ta cần phân tích rồi nhấp vào nút “Analyze”. Dưới đây là kết quả trả về tương ứng. Công cụ này phân tích được có một sự kiện (event) đang được đề cập đến trong câu ở trên, đó là dịp khuyến mãi đối với sản phẩm tấm topper nệm. Và điều quan trọng là ở đây, trái ngược với những gì chúng ta thường nghĩ, không có một thực thể nào tên là “best mattress topper” được nhận diện qua xử lý ngôn ngữ tự nhiên. Tuy nhiên, vì đây là một công nghệ mới nên sẽ cần thời gian để hoàn thiện thêm, nhưng quan trọng là công cụ NLP API không phải là bộ máy NLP thực sự đang được Google áp dụng, chúng ta chỉ sử dụng ví dụ này để hình dung về cách thức hoạt động của quá trình xử lý ngôn ngữ tự nhiên. Bạn có thể thấy nếu chúng ta thực hiện một thay đổi nhỏ trong câu được phân tích, chẳng hạn như hình dưới đây là thêm vào dấu “:” để giống hoàn toàn với tiêu đề gốc thì kết quả nhận được khá bất ngờ. Lúc này, NLP nhận diện được hai thực thể là “mattress topper” và “sale” với điểm số “Salience” là 0.52 (52%) và 0.48 (48%). Đây là mức điểm thể hiện tầm quan trọng, sự nổi bật hay mức độ trọng tâm của một thực thể trong đoạn văn bản được phân tích. Tuy nhiên thực thể “mattress topper” lại được phân loại là “person”. Do vậy bạn phải thật cẩn thận khi đặt tên trang của mình vì chỉ cần một sự thay đổi nhỏ cũng có thể khiến hệ thống xếp hạng cho một trang khác. Tuy không hoàn toàn giống nhau về bản chất và có độ chính xác cao nhưng ví dụ về công cụ ở trên có thể giúp chúng ta hiểu rõ hơn về cách Google xử lý và nhận diện đối tượng bằng NLP. Ngoài ra, nếu bạn cung cấp một đoạn văn bản đủ dài, công cụ này cũng có thể đưa ra phân tích về loại danh mục mà nội dung đó đang thể hiện. Ở đây chúng ta có kết quả danh mục là “Home & Garden/Bed & Bath”, với điểm “Confidence” là 0.99. Nghĩa là bộ máy chắc chắn 99% nội dung được phân tích có liên quan đến danh mục này. Và đây cũng là một cơ sở để xác định xem trang của bạn nói về chủ đề gì, khi nhìn vào những vị trí quan trọng như địa chỉ URL, Title, H1-H6, các câu chủ đề (topic sentence) của những đoạn văn, các tiêu đề nằm ở trên cùng của mỗi khu vực nội dung (block of text)... Tuy nhiên, danh mục được xác định này không phải là cơ sở để xếp hạng, mà chỉ là yếu tố hỗ trợ cho chủ đề mà trang đang thực sự nói đến trong nội dung – đây mới là yếu tố giúp cho trang được xếp hạng. Nhiều người thường hay cố gắng tăng điểm “confidence score” lên càng cao càng tốt vì họ nghĩ rằng điều đó sẽ giúp họ được xếp hạng cao hơn. Nhưng điều đó không đúng vì: Hệ thống không xếp hạng trang dựa trên danh mục; mà phân loại trang dựa trên thực thể lớn nhất (có điểm số “salience score” nổi bật nhất) được nhận diện trong nội dung được phân tích. Và việc xếp hạng sẽ dựa trên mức độ “Vector hóa” của nội dung, hay nội dung có phản ánh được vector đối với thực thể đó hay không. Nghĩa là nội dung của trang có xây dựng và đặt đầy đủ vector để bộ máy có thể nhận diện, liên kết và tổng hợp lại để biết được trang đang hướng đến chủ đề hay thực thể nào. Có thể hiểu một cách đơn giản: Vector là một khái niệm trừu tượng, thể hiện những gì cần thiết để “mang” một điểm đến một điểm khác. Giả sử trong nội dung của chúng ta có chứa các “manh mối” về một chủ đề X nào đó, nếu bộ máy có thể liên kết và tổng hợp các “manh mối” này lại thành một vector, nó có thể hiểu được nội dung đó đang “hướng về” chủ đề X (hãy hình dung các “manh mối” này đóng vai trò như là các yếu tố định hướng, tạo nên chiều trong không gian ngữ nghĩa dẫn bộ máy xử lý đi từ “nội dung” đến “chủ đề” thực sự mà nó đang muốn thể hiện). Như vậy, điểm số “Confidence” và danh mục được xác định ở trên không tác động đến việc xếp hạng, mà chỉ giúp hỗ trợ cho việc phân loại thực thể với điểm số “Salience” nổi bật trong nội dung được phân tích. Và đối tượng được xếp hạng ở đây không phải là “danh mục”, mà là “thực thể” được nhận diện. Đây cũng là một điều hợp lý vì tính cụ thể (specificity) sẽ đóng vai trò quan trọng. Chính sự phân loại cụ thể ở cấp độ “thực thể” mới là yếu tố hỗ trợ và đáp ứng cho truy vấn của người dùng, không phải là một danh mục được phân loại ở mức độ tổng quát (general categorization). Hãy nhớ, công cụ này chỉ được xem là mô phỏng cho công nghệ AI cùng với cơ chế xử lý ngôn ngữ tự nhiên NLP mà Google thực sự đang áp dụng. Ở đây chúng ta chỉ phân tích dựa trên một đoạn nội dung được nhập vào trực tiếp; không phải một web page. Một web page sẽ có địa chỉ URL, có Title... chứa các dữ liệu metadata mô tả về các đối tượng trên trang, bộ máy sẽ sử dụng những cơ sở này để phân loại “thực thể” và những gì mà nội dung trang đang trình bày, trước khi xem xét thêm những dữ kiện khác. Ngoài ra, Google rất hạn chế trong việc cung cấp những công cụ chính thức hỗ trợ cho giới SEO vì nguy cơ nhiều người sẽ lạm dụng nó để thao túng kết quả tìm kiếm (SERP). Đây là một vấn đề mà họ luôn muốn ngăn chặn và đồng thời nó cũng là một mâu thuẫn, bởi nếu có những công giúp cho việc làm SEO hiệu quả hơn thì chất lượng trang cũng sẽ được nâng cao và trải nghiệm người dùng cũng sẽ ngày càng được cải thiện – đó cũng là điều mà Google luôn muốn hướng đến. Tuy nhiên, ở thời điểm hiện tại, đây vẫn chỉ là một công cụ mô phỏng giúp chúng ta hiểu được cách thức bộ máy NLP sẽ xử lý và phân loại các đối tượng bằng cách nhìn vào những vị trí quan trọng nhất trên một trang và đưa ra một mức đánh giá xem trang có khả năng nói về chủ đề gì. Song song đó, cơ chế phân tích Vector cũng được thực hiện để phản ánh mức độ thể hiện của trang về chủ đề đó là bao nhiêu. Hai mức đánh giá này sẽ được kết hợp với nhau (gần đây, vai trò của Vector thể hiện nhiều sức mạnh hơn) làm cơ sở cho việc quyết định thứ hạng. Ngoài ra, công cụ NLP API của Google còn cung cấp thêm chức năng phân tích cả cú pháp ngữ pháp (grammar syntax) của nội dung tại tab “Syntax”. Các thực thể sẽ được nhận diện và phân loại dựa trên kết quả phân tích cú pháp của câu. Và đây cũng chính là cách mà Vector hoạt động. Vector được hình thành từ những từ thường đứng gần nhau hoặc xuất hiện cùng nhau. Hãy nhớ là NLP hoạt động dựa trên nền tảng là cụm từ còn Vector sẽ dựa trên các đơn vị từ. Bởi nếu đổi Vector hoạt động trên cơ chế ghép cụm từ thì sẽ có vô số tổ hợp và biến thể được tạo thành và có thể vượt quá khả năng xử lý của bộ máy. Giả sử chúng ta có hai tài liệu chứa các từ ngữ. Làm thế nào để một bộ máy không có khả năng phân tích và tư duy như con người có thể biết chúng nói về cùng một chủ đề? Nếu cả hai đều đề cập đến cùng một từ nào đó nhiều lần thì có thể chúng đang nói về cùng một chủ đề. Đó là cách làm trước đây của Google, nhưng từ lâu Google đã thực hiện một số thay đổi để cơ chế xử lý trở nên tinh vi hơn. Chúng ta có những từ màu đỏ là những từ quan trọng (những từ nằm trong truy vấn của người dùng). Sử dụng lại ví dụ về “best mattress topper” ở phía trên, NLP sẽ hoạt động theo cơ chế đối sánh với cụm từ “best mattress topper”, còn Vector sẽ tìm kiếm theo các đơn vị từ ngữ “best”,“mattress” và “topper”. Bộ máy xử lý sẽ nhìn vào các từ xuất hiện bên cạnh “node”1 (gọi là collocate). Đây là những từ được đặt ở bên trái hoặc phải, trước hoặc sau các từ nằm trong truy vấn mà người dùng đang tìm kiếm (“best”,“mattress”,“topper”) có mức độ quan trọng giảm dần theo khoảng cách và càng được kết hợp với nhau thành một cụm từ tiêu biểu (collocation), càng ở gần “node” thì những từ này sẽ càng tạo ra nhiều sức mạnh hơn. 1. Theo thuật ngữ của công nghệ xử lý ngôn ngữ, “node” là từ trung tâm trong một collocation (sự kết hợp tiêu biểu của những từ đơn với nhau hay những từ thường đi cùng với nhau). Ví dụ như: “strong wind” = “strong” (là collocate) + “wind” (là node). Bạn có thể sẽ thấy cơ chế này giống với LSI hay TF-IDF. Nhưng về bản chất thì chúng lại hoàn toàn khác biệt. LSI có thể được đặt ở bất kỳ đâu trong nội dung của trang. Còn TF-IDF (Term Frequency – Inverse Document Frequency) sẽ đánh giá tầm quan trọng một từ/ cụm từ, thông qua số lần xuất hiện của nó trong tài liệu so với tần suất của từ/cụm đó trong toàn bộ tập dữ liệu. Chính xác thì Vector có liên quan đến “collocation”. Vector tập trung vào những từ quan trọng (node) được kết hợp với những từ khác (collocate) để tạo thành một cụm từ đặc trưng (collocation) và những từ ngữ này có thể được đề cập đến tại bất kỳ đâu trong toàn bộ corpus2 trên Internet hoặc tất cả các trang mà Google đã tìm thấy và quét qua. 2. Corpus là một dữ liệu tập hợp các văn bản, ngôn ngữ đã được số hóa. Ví dụ, đối với một từ quan trọng trong tài liệu #1 dưới đây, bộ xử lý có thể so sánh và đánh giá mức độ tương đồng của nó so với một tài liệu #2 khác bởi vì tài liệu #1 có sự trùng khớp và thể hiện cùng một mẫu hình đặc trưng (typical pattern) trong nội dung; cụ thể là tại bất kỳ nơi nào mà từ quan trọng đó được đề cập thì xung quanh nó luôn có những từ kết hợp tương ứng đi kèm (collocate) như trong tài liệu #2 và những từ này trở nên rất mạnh mẽ trong việc thúc đẩy sự tồn tại của từ trung tâm, cho bộ máy xử lý biết được trang của bạn nói về từ quan trọng đó. Các mẫu hình đặc trưng này sẽ giúp xác minh cho tài liệu đang được đối sánh. Tài liệu đó có thể nói về những khái niệm và sự vật khác nhau có liên quan đến chủ đề chính nhưng khi đề cập đến từ quan trọng thì ở một mức độ nhất định (%), nó luôn có những từ kết hợp đi kèm mà những tài liệu khác trong toàn bộ corpus cũng đề cập đến (đây chính là mẫu hình cụm từ đặc trưng được áp dụng thể hiện mối quan hệ giữa “node” và “collocate” trong việc hình thành nên “collocation” được sử dụng phổ biến khi nói về một chủ đề nào đó). Vector sẽ hoạt động dựa trên cơ chế như thế. Ngoài ra, cũng có một công cụ hỗ trợ giúp phân tích các địa chỉ URL và cho chúng ta biết chính xác những từ ngữ nào sẽ phối hợp với nhau để tạo thành collocation. Tóm lại, NLP sẽ hoạt động theo cơ chế giống với những gì chúng ta đã được quan sát qua công cụ Natural Language API của Google. Nó sẽ nhìn vào địa chỉ URL, Title và những vị trí định danh quan trọng trên trang để xác định xem trang nói về điều gì, đối tượng thực thể mà trang đang thể hiện, mức độ nổi bật và quan trọng của thực thể đó đối với trang này ra sao. Còn Vector sẽ hoạt động và đánh giá dựa trên mức độ trùng khớp với các collocation có trong nguồn corpus (các cụm từ này được trang sử dụng ở mức độ nào). Bởi vì trong nội dung, chúng ta đang trình bày các từ ngữ được kết hợp cùng với nhau (collocated words) tại những vị trí thường được kết hợp cùng với nhau (collocated places). Nghĩa là: bạn sẽ trình bày từ ngữ theo sự kết hợp đặc trưng và phổ biến nhất (collocated words) và đặt các collocation này vào những vị trí quan trọng, thường đi chung với nhau và được liên kết với nhau nhiều nhất (collocated places) để tạo nên sức mạnh và bối cảnh ngữ nghĩa rõ ràng cho bộ máy xử lý. Bạn càng biết nhiều về các collocation và mức độ đặc trưng hay phổ biến của chúng trong tệp dữ liệu corpus, bạn sẽ càng biết cách tạo ra tỷ trọng Vector cao hơn và làm cho trang của mình thể hiện thật cụ thể, rõ ràng về bất cứ chủ đề nào mà NLP đã phân loại cho trang trước đó. Đây chính là lý thuyết về Bộ máy Ngữ nghĩa và cơ chế vận hành của nó. TÓM TẮT ☑ Các nghiên cứu và thử nghiệm vào tháng 1 năm 2020 đã cho thấy Google đang ứng dụng một mô hình xử lý ngôn ngữ tự nhiên NLP để xác định xem nội dung của một web page nói về chủ đề gì. ☑ Các nghiên cứu cũng cho thấy cơ chế này được áp đụng để cải thiện hiệu quả của việc nhận diện và phân loại, không phải cho việc xếp hạng. ☑ Bộ máy xử lý sẽ chọn ra các “thực thể” bằng cách phân tích cấu trúc ngữ pháp của câu và cụm từ/ hoặc về cơ bản, là chọn ra các “sự vật” và xác định những cụm từ nào cho biết rằng trang đó nói về điều gì. Có sự kết hợp của các thuật toán với nhau. NLP hoạt động từ đầu trang trở xuống, nhìn vào các cụm từ và cách diễn đạt. Sau đó bộ máy xử lý sẽ sử dụng khoảng cách gần nhau của Vector (Vector proximity) để đánh giá xem tài liệu này trùng khớp (match) với chuẩn đối sánh cho chủ đề đó ở mức độ nào. Vector hoạt động chủ yếu từ phần của nội dung trở xuống, nhìn vào khoảng cách gần nhau của các từ đơn (single word). ☑ Chúng ta sẽ sử dụng công cụ phân tích collocation để tìm cách làm cho nội dung “khớp” với các vector này, từ đó tăng được mức độ thấu hiểu của bộ máy xử lý đối với trang và nâng cao thứ hạng. #6 “ĐÁNH CẮP” CHIẾN LƯỢC LIÊN KẾT NỘI BỘ CỦA ĐỐI THỦ T rong ngành SEO, việc áp dụng kỹ thuật đảo ngược (reverse engineer) để lần theo và truy tìm nguồn gốc của một vấn đề hay yếu tố nào đó rất được yêu thích. Thường thì cách làm này được sử dụng nhiều nhất đối với các backlink. Tuy nhiên, bạn có thể đạt được những kết quả nhanh chóng thông qua kỹ thuật đảo ngược này bằng cách khám phá các đối thủ cạnh tranh hàng đầu để xem chiến lược liên kết nội bộ của họ là gì, từ đó ta có thể mô phỏng lại tương tự. Nhờ vào một tính năng mới trên Ahrefs, bạn có thể thực hiện việc này dễ dàng hơn rất nhiều. Để kiểm tra các anchor text và nội dung bổ trợ (supporting content), bạn có thể làm theo các bước sau: Bước 1: Nhập vào địa chỉ URL của đối thủ. Bước 2: Nhấp vào mục “Internal Backlinks”. Sau khi nhấp vào, bạn sẽ được chuyển đến một trang liệt kê tất cả các liên kết nội bộ của các đối thủ. Bước 3: Kiểm tra và phân tích. Bước này sẽ hiển thị cho bạn một số thông tin quan trọng. Ở cột bên trái, bạn sẽ thấy số lượng các liên kết và số lượng các page trỏ đến (referring page), hay còn gọi là các page bổ trợ (supporting page). Ở khu vực phía bên tay phải, công cụ này sẽ hiển thị cho bạn anchor text và backlink cụ thể. Và bạn có thể xuất tất cả các dữ liệu này vào một tệp riêng. Thực hiện việc phân tích như thế đối với nhiều trang khác nhau của những đối thủ cạnh tranh hàng đầu không chỉ giúp bạn xây dựng được một kế hoạch hiệu quả, mà còn có thể khám phá ra được chiến lược tổng quát của họ dựa trên một mô hình (pattern) hoặc xu hướng nào đó. Tuy là vậy, có một điều bạn phải cực kỳ lưu ý, đó là không nên quá dựa vào anchor text mà đối thủ đang sử dụng. #7 ANCHOR TEXT DÙNG CHO LIÊN KẾT NỘI BỘ (INTERNAL LINK): DỰA TRÊN Ý NGHĨA THẬT SỰ THAY VÌ TỪ NGỮ M ột lỗi phổ biến mà nhiều người thường mắc phải đó là tư duy về các anchor text dùng cho liên kết nội bộ (internal link) cũng giống như cách họ đặt anchor text cho backlink. Khi đề cập đến việc xây dựng backlink trỏ về website của bạn, chúng ta thường thích sử dụng những anchor text trùng khớp chính xác với từ khóa sao cho càng cụ thể càng tốt. Tuy nhiên, đối với các liên kết nội bộ, chúng ta có cần làm như vậy không? Câu trả lời là có và không. Xét trên ngữ cảnh của website, chúng ta cần tối ưu hóa các liên kết của mình dựa trên giả định là các bot của máy tìm kiếm đã biết nó nói về nội dung gì. Điều này đồng nghĩa với việc anchor text của chúng ta trong trường hợp này không cần phải quá chi tiết. Ví dụ: Bạn có thể dùng anchor text “Các công cụ SEO hiệu quả nhất” khi xây dựng backlink, còn anchor text “Các công cụ SEO” sẽ dành cho các liên kết nội bộ. Trong bối cảnh SEO hiện tại, chúng ta đang bàn luận nhiều về tầm quan trọng của các thực thể và một sự vật cũng được xem là một thực thể. Trong bằng sáng chế Providing search results based on sorted properties (tạm dịch: Cung cấp các kết quả tìm kiếm dựa trên các thuộc tính được sắp xếp và phân loại), định nghĩa về thực thể được trình bày như sau: “Một thực thể là một sự vật hoặc khái niệm đơn nhất, độc nhất, được xác định rõ ràng và có thể phân biệt được. Ví dụ, thực thể có thể là một người, địa điểm, một vật, ý tưởng, chủ đề, khái niệm trừu tượng, yếu tố cụ thể, những sự vật còn lại đáp ứng được những tiêu chí đó hoặc bất kỳ sự kết hợp nào kể trên.” Quay trở lại với vấn đề,“Các công cụ SEO” trong ví dụ trên còn được biết đến với tên gọi là anchor text trùng khớp một phần (partial match anchor). Loại anchor text này có tác động lớn và sẽ giúp mang lại những kết quả tốt hơn nếu được dùng trong các liên kết nội bộ. Hiện nay mọi người đang thảo luận rất nhiều về xu hướng “things not strings” (tạm dịch: Vật thể, không phải chuỗi), vì việc sử dụng các tham chiếu rộng (broad reference) hoặc đề cập đến “đối tượng” đang muốn nói đến trong anchor text đang trở hiệu quả hơn với trước đây. “Things not strings” là cụm từ chỉ khả năng của máy tìm kiếm có thể thực sự diễn giải ý nghĩa và nhận diện các sự vật/sự việc/đối tượng ẩn sau các từ ngữ và đưa ra các câu trả lời phù hợp, không phải dựa trên những từ hay cụm từ cụ thể. Trong phần sau của tài liệu này, bạn sẽ được tìm hiểu về công cụ NLP Demo của Google. Đây là một công cụ kỳ hữu ích trong việc giúp bạn tối ưu hóa các anchor text dựa trên quan điểm “things not strings” như trên. #8 TÌM KIẾM CÁC CƠ HỘI ĐẶT LIÊN KẾT NỘI BỘ BẰNG GOOGLE SEARCH B ạn có bao giờ tự hỏi làm thế nào mà một số website lại xây dựng được hệ thống liên kết nội bộ rất tốt không? Câu trả lời có thể khác nhau, nhưng có một cách chính là: họ khai thác và sử dụng những gì họ đã có; và họ thực hiện việc đó một cách đều đặn. Sau đây là một gợi ý nhỏ cho bạn: Bước 1: Truy cập vào Google. Bước 2: Tìm kiếm theo cú pháp sau đây: site:tênmiền.com intext: “từ khóa” Kết quả tìm kiếm cho cú pháp này sẽ trả về một danh sách các địa chỉ URL có chứa từ khóa của bạn. Và sau đó, bạn có thể đặt anchor text cùng liên kết nội bộ phù hợp giữa các trang với nhau. Lưu ý: Bạn cũng có thể áp dụng cách làm này để kiểm tra các anchor text, thay vì từ khóa. #9 ĐẶT LIÊN KẾT NỘI BỘ TỪ NHỮNG LINK HOTSPOT T heo thời gian, hầu hết các website lớn và có tuổi thọ cao sẽ bắt đầu phản ánh quy luật dưới dạng lũy thừa một cách tự nhiên. Một trong những quy luật đó chính là Nguyên tắc Pareto (hay còn được biết đến với tên gọi Quy tắc 80/20), chỉ ra rằng 80% của bất kỳ kết quả nào đều sẽ được tạo ra từ 20% nguồn lực. Và khi đề cập đến backlink, 20% nguồn lực này sẽ được gọi là các Link Hotspot (có thể hiểu như đây là các “điểm nóng” liên kết, là những khu vực chính hay phổ biến được nhiều link trỏ đến nhất). Rõ ràng trang chủ (homepage) là một link hotspot, tuy nhiên nó không phải là duy nhất. Trong Ahrefs, hãy đi đến mục “Pages”, chọn “Best By Links”: Và bạn sẽ thấy được giao diện như hình dưới đây: Thường thì sẽ có các link hotspot khác không phải là trang chủ xuất hiện trong kết quả. Khi so sánh giữa các trang với nhau, các page được xem là link hotspot này sẽ truyền đi một lượng giá trị lớn hơn hẳn đến các trang khác trong website của bạn, so với những trang còn lại chỉ chiếm ¼ tổng số lượng liên kết (20% các trang – là các link hotspot, sẽ tạo ra 80% sức mạnh). Ngoài ra, đa số các trang trên website đều có ít hoặc không có backlink. Theo một nghiên cứu của Ahrefs, có đến 55,24% số lượng trang không có tên miền nào trỏ đến (referring domain), điều này còn giúp củng cố thêm luận điểm rằng các link hotspot là những trang cực kỳ quan trọng. Do đó, việc tối cần thiết là không chỉ đưa ra một chiến lược để tạo nên những trang như thế, mà còn phải tận dụng tối đa tiềm năng của những trang hiện có với vai trò là nội dung bổ trợ (supporting content) cho chúng. ☑ Bước 1: Đi đến một trang là link hotspot trên website. ☑ Bước 2: Nhấn CTRL + F hoặc CMD + F (nút lệnh dùng để tìm kiếm). ☑ Bước 3: Gõ vào từ khóa mục tiêu hoặc anchor text cần tìm kiếm. ☑ Bước 4: Chèn liên kết nội bộ vào trang mục tiêu khi thấy nội dung trên trang trùng khớp với từ khóa/anchor text và có ngữ cảnh phù hợp. #10 KHAI THÁC YẾU TỐ RELEVANCE ĐỂ INTERNAL LINK VÀ BACKLINK TRUYỀN ĐI NHIỀU GIÁ TRỊ HƠN B ạn có muốn biết cách dễ dàng nhất để làm cho những liên kết của bạn truyền đi nhiều giá trị hơn không? Câu trả lời rất đơn giản. Bạn chỉ cần tăng cường độ liên quan và độ phù hợp (relevance). Phương pháp này có thể được thực hiện thông qua ba bước: • Đặt từ khóa vào trong tiêu đề (Title) • Đặt từ khóa vào trong thẻ H1 • Đặt từ khóa vào trong địa chỉ URL Bạn cần đảm bảo đặt từ khóa vào trong ba vị trí này và bạn sẽ thấy được những sự thay đổi lớn trong kết quả, đặc biệt là từ những chiến dịch link building đã triển khai. Theo những nghiên cứu đã được thực hiện, ba yếu tố này sẽ giúp cải thiện thứ hạng tổng thể cho website. #11 SỬ DỤNG YOUTUBE ĐỂ PHÁT TRIỂN Ý TƯỞNG NỘI DUNG M ẹo này đặc biệt hữu ích để tạo nên các nội dung bổ trợ, chỉ cần có thêm một số hoạt động quảng bá, sẽ có khả năng mang lại cho bạn rất nhiều backlink. Giá trị của cách làm này nằm ở chỗ, sau khi xây dựng được nội dung như trên, bạn có thể tăng sức mạnh cho các nội dung có liên quan khác bằng một bài hỗ trợ đang sở hữu một lượng sức mạnh (juice) đáng kể. Khi tìm thấy những video có nhiều lượt xem, thì đây có thể là dấu hiệu tốt cho thấy đó là một chủ đề “nóng” nhận được nhiều sự quan tâm. Sau đây là cách thực hiện: Bước 1: Truy cập vào YouTube. Bước 2: Tìm kiếm các từ khóa của bạn. Bước 3: Kiểm tra lượt xem của các video. Hãy lặp lại quá trình này để tạo ra một danh sách lớn bao gồm nhiều ý tưởng chính (seed list), sau đó tiến hành nghiên cứu và phân tích sâu hơn để xác định xem những nội dung nào cần nhắm đến trước tiên. #12 TÌM NHỮNG Ý TƯỞNG MẠNH ĐỂ XÂY DỰNG NỘI DUNG BỔ TRỢ BẰNG GOOGLE SEARCH CONSOLE (GSC) B ạn có muốn xác định CHÍNH XÁC xem Google đang cho rằng những nội dung hiện tại của mình có liên quan đến chủ đề hay lĩnh vực nào không? Chắc chắn là tất cả chúng ta đều muốn thế. Search Console là một công cụ rất hữu dụng trong việc thu thập các ý tưởng mới cho nội dung và phần này sẽ tập trung hướng dẫn cho bạn cách sử dụng GSC để xác định những ý tưởng mạnh phục vụ cho việc xây dựng các nội dung bổ trợ (supporting content). Các liên kết nội bộ có thể cực kỳ mạnh mẽ và việc chèn vào nhiều internal link là một trong những cách dễ nhất để cải thiện thứ hạng. Mặt khác, ngoại trừ lý do đầu tiên là không xây dựng đủ internal link, lý do chính mà nhiều người làm SEO vẫn đang không đạt được thứ hạng tốt dù đã thực hiện liên kết nội bộ chính là:Nội dung bổ trợ của họ quá tệ. Có nhiều cách hiệu quả để khắc phục vấn đề này, bạn có thể thực hành theo hướng dẫn sau: Bước 1: Truy cập vào Google Search Console. Lưu ý: Bạn cần có một tài khoản Google Search Console và đã có dữ liệu tối thiểu trong 30 ngày mới có thể thực hành theo các bước sau đây. Bước 2: Tạo bộ lọc hiển thị. Nhấp vào “Performance”. Nhấp vào “Impressions”. Sau đó nhấp bỏ chọn “Total clicks” (lúc này đồ thị sẽ không biểu diễn các kết quả về tổng số lượt nhấp nữa). Tiếp theo, hãy cuộn chuột xuống phía dưới, nhấp vào mục “Pages”. Bước 3: Chọn page của bạn. Bước tiếp theo là chọn money page hoặc nội dung quan trọng nào đó mà bạn muốn tìm các ý tưởng để xây dựng nội dung bổ trợ cho nó. Chỉ cần nhấp chuột vào địa chỉ URL mà bạn muốn tìm hiểu thêm chi tiết. Bước 4: Thay đổi lại khung hiển thị. Giờ thì bạn đã lựa chọn xong trang của mình rồi, chúng ta sẽ quay lại khung hiển thị ở mục “Queries”. Lúc này sẽ giao diện sẽ hiển thị các truy vấn có liên quan đến trang mà bạn đã chọn. Từ đây bạn có thể tự phân tích các cơ hội tiềm năng một cách thủ công, hoặc nếu có quá nhiều dữ liệu, bạn nên sử dụng tính năng xuất dữ liệu ra một tệp để thuận tiện cho việc thao tác. #13 HAI CÁCH DỄ DÀNG ĐỂ TÌM KIẾM TỪ KHÓA CHO NGÁCH THỊ TRƯỜNG BẤT KỲ Đ ến đây, bạn đã có được rất nhiều ý tưởng cho nội dung bổ trợ, nhưng không phải tất cả ý tưởng này đều có nhiều lượng tìm kiếm (search volume). Bạn muốn đưa được nhiều người hơn vào phễu chuyển đổi khách hàng bằng các nội dung này, vậy bạn có thể làm gì? Hãy tham khảo qua hai phương pháp độc đáo dưới đây và thực hiện lặp đi lặp lại thường xuyên. 1. Thu thập các từ khóa trong những nội dung Q&A từ Quora Quora là một nền tảng nội dung khổng lồ đa lĩnh vực. Bạn gần như có thể tìm được các câu hỏi về mọi lĩnh vực ở trên đây. Số lượng từ khóa mà nó xếp hạng là hơn 62 triệu và con số này chắc chắn sẽ không dừng lại ở đó. Điều này làm cho Quora trở thành một nguồn cực kỳ lý tưởng để thu thập từ khóa cho bất kỳ ngách thị trường nào. Bước 1: Nhập địa chỉ Quora.com vào Ahrefs (hoặc công cụ khác). Chỉ cần nhập tên miền gốc (root domain) của Quora vào các công cụ như Ahrefs, SEMRush... Bước 2: Nhấp vào “Organic keywords”. Bây giờ hãy tạo bộ lọc hiển thị bằng cách nhấp chuột vào phần “Organic keyword” (nếu sử dụng Ahrefs). Bước 3: Lọc kết quả theo TỪ KHÓA. Bước 4: Thêm các bộ lọc và xuất dữ liệu. Bây giờ, bạn cần áp dụng thêm một vài bộ lọc nữa và xuất danh sách dữ liệu này ra. Vậy là công việc của bạn đã hoàn tất. 2. Thu thập từ khóa từ các diễn đàn Các diễn đàn (forum) hiện nay không còn phổ biến như ngày trước, nhưng những forum nào còn tồn tại đến ngày nay thường có quy mô rất lớn và trên Internet vẫn có một số diễn đàn hoạt động sôi nổi với số lượng thành viên khổng lồ. Hãy nhắm đến những địa chỉ tiềm năng này để “đào” và thu thập các từ khóa. Bước 1: Tìm kiếm một diễn đàn. Cách dễ dàng nhất để tìm kiếm các forum lớn chính là sử dụng website: https://www.findaforum.net/ Bước 2: Nhập địa chỉ của diễn đàn đó vào Ahrefs hoặc công cụ tương tự. Chỉ cần gõ địa chỉ của diễn đàn vào một công cụ phân tích. Bước 3: Nhấp vào “Organic keywords”. Cách làm bước này hoàn toàn giống với hướng dẫn ở phần Quora. Bước 4: Lọc kết quả theo từ khóa. Giả sử ở đây chúng ta sử dụng cụm từ chính là “Boeing”. Bước 5: Thêm các bộ lọc khác và xuất dữ liệu. Các từ khóa này có lượng tìm kiếm ít hơn đáng kể, nhưng đồng thời chúng cũng là những từ khóa tiềm năng để nhắm mục tiêu vì gần như những từ khóa này đều khá dễ để xếp hạng. #14 TỐI ƯU HÓA TÍNH LIÊN QUAN VỀ CHỦ ĐỀ ĐỂ THOÁT KHỎI TÌNH TRẠNG “ĐÓNG BĂNG” THỨ HẠNG B ạn đã từng gặp trường hợp có những bài viết hoặc sản phẩm bị mắc kẹt ở trang SERP thứ hai và dù bạn có làm gì, nó cũng không dịch chuyển thứ hạng chưa? Ngay cả khi bạn đã bổ sung thêm các liên kết, điều chỉnh lại nội dung, chèn thêm các liên kết nội bộ và nhiều nỗ lực tối ưu khác? Vậy lý do là gì? Đối với những tình huống như vậy, thường thì do bạn đang bỏ sót việc tối ưu hóa theo chủ đề (topical optimization). HAI KỊCH BẢN CÓ THỂ XẢY RA 1. Một hoặc một số khu vực nào đó trên website của bạn đang “kiềm hãm” lại độ liên quan về chủ đề (topical relevance). Trong trường hợp này, bạn cần gỡ đi liên kết (UNLINK) với một số bài viết không có đủ độ liên quan và phù hợp. Điều này nghe có vẻ không đúng và hơi khác thường, nhưng nó thực sự mang lại hiệu quả. Trên đây là hình ảnh kết quả thu được sau một vài thử nghiệm: • Lấy một website đang bị “đóng băng” thứ hạng. • Bỏ đi một silo có trên website đó. • Thêm silo đó vào một tên miền mới. • Chuyển hướng các địa chỉ URL có trong silo cũ sang các địa chỉ URL ở website mới. Từ đồ thị trên, bạn có thể thấy rằng trang này có sự đột phá trong kết quả (biểu thị bằng đường dốc lên). Đôi khi những gì bạn không trình bày cũng quan trọng như những gì bạn trình bày vậy. Đây chính là lý do tại sao các niche site (website ngách) lại hoạt động rất hiệu quả do nó chỉ tập trung vào một lĩnh vực hoặc chủ đề cụ thể, và tại sao khi xây dựng các authority site bạn phải cần đến yếu tố ĐỘ UY TÍN. 2. Không có đủ nội dung bổ trợ có liên quan cho chủ đề Chỉ vì chúng ta nghĩ nội dung của mình đã đủ liên quan không có nghĩa là Google cũng sẽ nghĩ như thế. Bạn có thể cần đến nhiều nội dung bổ trợ khác nhau để tạo nên sự chuyển biến về thứ hạng. Biểu đồ Venn phía trên là một hình ảnh minh họa có thể cung cấp một số gợi ý để bạn thực hiện cho website của mình: • Gỡ bỏ đi những liên kết nội bộ không liên quan. • Giữ lại một phần những liên kết nội bộ ban đầu. • Giả sử bạn có ba bài viết chính (money article), bạn có thể bổ sung thêm ba nội dung hỗ trợ mới trỏ link đến 1, 2 hoặc cả ba bài viết này. • Đợi trong khoảng thời gian 30 ngày để thu được kết quả tối đa. Thường thì kết quả sẽ là các bài viết mục tiêu thoát khỏi tình trạng “đứng yên” ở vị trí hiện tại và có sự chuyển biến trong thứ hạng. Bên cạnh đó, bạn cũng nên đặt mục tiêu tạo ra các nội dung chặt chẽ theo mô hình trung tâm như hình dưới đây. Trong mô hình này, phần lớn các nội dung đều bổ trợ cho một chủ đề cụ thể và chủ đề đó có thể có nhiều bài viết chính (money article). Việc tiếp cận từ quan điểm xây dựng nội dung bổ trợ cho chủ đề thay vì bổ trợ cho các bài money post sẽ giúp bạn đạt được những kết quả tốt hơn cho hoạt động SEO. #15 CHÈN NỘI DUNG BỔ TRỢ DƯỚI DẠNG TRANG VÀ NỘI DUNG CHÍNH DƯỚI DẠNG BÀI VIẾT Đ ôi khi, việc sử dụng các trang (page) thay cho các bài viết (post) có thể trở nên hữu ích, đặc biệt là đối với các nội dung bổ trợ. Lý do về mặt SEO cho hành động này là nó sẽ “dời” những nội dung bổ trợ ra khỏi blogroll (là khu vực có đặt liên kết trỏ đến những nội dung khác nhau), mà thường sẽ là trang chủ. Chẳng hạn trên nền tảng WordPress, bạn có thể thấy hai kiểu thiết lập trang chủ phổ biến là “Static page” (một trang tĩnh với các thành phần cố định) và “Blogroll” (các bài viết mới sẽ được cập nhật lên trang chủ tổng hợp thành một danh sách liệt kê). Tuy nhiên, thông thường mọi người luôn làm ngược lại và điều này không phải lúc nào cũng hợp lý. Vì trang chủ chính là trung tâm tập trung nhiều sức mạnh về độ uy tín (authority) nhất đối với phần còn lại của website, bạn có thể chuyển các nội dung bổ trợ sang các trang (pages) và bảo toàn phần lớn lượng link equity (hay còn gọi là link juice, chỉ sức mạnh truyền qua các đường link) cho money content (nội dung chính) của mình. #16 THAY ĐỔI SCHEMA TƯƠNG ỨNG KHI SỬ DỤNG CÁC TRANG THAY CHO CÁC BÀI VIẾT S chema hay còn gọi là Schema Markup là một loại ngôn ngữ dùng để đánh dấu các dữ liệu có cấu trúc (structured data), giúp máy tìm kiếm dễ dàng nhận diện và phân loại website hơn thông qua các thông tin được khai báo. Một lỗi mà gần như SEOer nào cũng từng mắc phải chính là chuyển bài viết thành trang – nhưng lại không chuyển kèm Schema tương ứng. Lý do tại sao điều này lại quan trọng rất rõ ràng, tất nhiên là bạn muốn sử dụng đúng Schema Markup cho những nội dung của mình để máy tìm kiếm hiểu được chính xác về nó. Nhưng lý do nhiều người vẫn không chú ý đến vấn đề này lại không rõ ràng như thế. Trên WordPress, hai định dạng trình bày nội dung Pages (trang) và Posts (bài viết) sử dụng các mẫu (template) khác nhau. Điều này có nghĩa là khi tác giả thiết kế các theme giao diện, họ cho rằng bạn sẽ chỉ sử dụng định dạng Posts để đăng tải các nội dung. Vậy nên ngôn ngữ Schema được sử dụng cũng hoàn toàn khác. CÔNG CỤ STRUCTURED DATA TOOL Bạn có thể dùng công cụ Google Structured Data Tool để xác định xem Schema Markup nào đang được sử dụng cho các bài viết nhưng chưa được sử dụng cho các trang và ngược lại. Dưới đây là địa chỉ truy cập vào công cụ này: https://search.google.com/structured-data/testing-tool/u/0/ Kiểm tra dữ liệu có cấu trúc của bạn Gợi ý: Bạn có thể xem qua các video trên Youtube hướng dẫn cách thêm Schema vào website của mình (chẳng hạn như video “How To Add JSON-LD Schema To WordPress” của Daniel Cuttridge). #17 CÁC SCHEMA MARKUP CẦN SỬ DỤNG N hư đã trình bày ở trên, các tác giả theme có thể không biết bạn dự định sử dụng website thế nào và không phải lúc nào họ cũng biết Schema nào hiệu quả nhất đối với hoạt động SEO. Vì vậy, có rất nhiều thông tin sẽ bị thiếu. Các Schema Markup bạn nên sử dụng khi có thể: • Table Markup • ItemList Markup • Speakable Markup • FAQ Markup • Q&A Markup • HowTo Markup • Author Markup • sameAs Markup Tài liệu này sẽ không đi sâu vào cách khai báo Schema cụ thể, bạn có thể dễ dàng tìm được thông tin về các loại markup này kèm hướng dẫn chi tiết trên website Schema.org hoặc qua các nguồn tham khảo như Youtube. Giao diện của website schema.org Tuy nhiên, bạn cần ghi nhớ là những Schema được liệt kê trên đây đều là những dữ liệu nổi bật mà mọi website nên lấy làm tiêu chuẩn khi khai báo các kiểu nội dung (content type) nhất định hoặc thậm chí trong một số trường hợp, là cho toàn website. #18 SỬ DỤNG CẤU TRÚC THEO CHIỀU RỘNG (FLAT STRUCTURE) Ở TẦNG TRÊN CỦA WEBSITE H iện nay, số lượng website cực kỳ lớn. Do vậy, việc thu thập dữ liệu (crawling), theo ước tính, sẽ dần trở nên tốn kém nhiều nguồn lực và đắt đỏ hơn theo thời gian. Những người làm SEO đều nhìn thấy một sự thật rằng: Những website nào tạo điều kiện thuận lợi cho việc thu thập dữ liệu của máy tìm kiếm sẽ có được một lợi thế đáng kể. Cách hiệu quả nhất để làm cho website của bạn trở nên thân thiện với các bọ quét như Googlebot chính là giảm đi “crawl depth” (là mức độ hay độ sâu mà máy tìm kiếm thu thập dữ liệu và lập chỉ mục cho các trang có trong một website). Ngoài ra, thuật ngữ này đôi khi còn được gọi là “click depth” (một khái niệm dùng để mô tả người dùng cần phải thực hiện bao nhiêu lần nhấp chuột để đến được một trang cụ thể). THU THẬP DỮ LIỆU 1. Độ sâu của việc thu thập dữ liệu (Crawl Depth Intensity) Số lượt click cần thực hiện để đến được các địa chỉ URL cũng là một yếu tố cần phải cân nhắc. Phần lớn các địa chỉ URL của bạn đang có Crawl Depth ở mức nào: 1, 2, 3 hay cao hơn? Việc giảm đi Crawl Depth của phần lớn địa chỉ URL, là một cách có thể giúp bạn cải thiện khả năng được quét qua và thu thập dữ liệu của website. 2. Độ rộng của việc thu thập dữ liệu (Crawl Depth Extensity) Độ rộng là một khái niệm hoàn toàn khác, là mức độ mà cấu trúc của bạn mở rộng tới xét trên tổng thể, hay nói cách khác chính là “phạm vi” hoặc “quy mô”. Khi bạn tối ưu hóa, hãy tối ưu hóa cho cả độ sâu và độ rộng của việc thu thập dữ liệu. Cả hai yếu tố này đều quan trọng. XÂY DỰNG CẤU TRÚC WEBSITE PHÙ HỢP Trước khi tìm hiểu sâu hơn, hãy cùng làm rõ một số luận điểm sau: • Máy tìm kiếm = Hoạt động lập chỉ mục và truy xuất các thông tin. Vậy… • Cấu trúc thông tin = Cốt lõi của hoạt động SEO. Theo định nghĩa từ trang Usability.gov thì: “Information architecture (hay IA, tạm dịch: cấu trúc thông tin) tập trung vào việc tổ chức, cấu trúc và phân loại nội dung sao cho hiệu quả, bền vững. Mục tiêu của IA là để giúp người dùng tìm thấy được thông tin mình cần và hoàn tất các tác vụ của họ.” Nếu người dùng cảm thấy khó khăn trong việc hoàn thành hành động mà họ mong muốn, thì các doanh nghiệp không thể thu thập được thông tin liên hệ của khách hàng đó, có thể mất đi doanh số và cả mức độ tín nhiệm dành cho thương hiệu. 1. Taxonomy là gì? Taxonomy là thuật ngữ được dùng để mô tả một hệ thống dùng để định danh (labeling) và tổ chức phân loại các đối tượng chủ thể, các sự vật hoặc khái niệm vào cùng một nhóm có chung các đặc điểm tương đồng nào đó. Có nhiều loại taxonomy khác nhau, một trong số những loại đó chính là hệ thống phân loại theo cấp bậc (hierarchical taxonomy). Cách tổ chức phân loại này tuân thủ theo cấu trúc cha/con. 2. Cấu trúc phân cấp Đây là một kiểu tổ chức IA phổ biến. Đa số toàn bộ các website thành công đều xây dựng theo một cấu trúc phân cấp có dạng như sau: Danh mục cha > Danh mục con Về bản chất, hệ thống phân cấp này có sự phân chia rõ ràng và dễ hiểu đối với người dùng, do đó, những người làm SEO như chúng ta đã xây dựng các website, phát triển các trình thu thập dữ liệu cùng nhiều sản phẩm khác dựa trên cấu trúc này. 3. Cấu trúc Silo Cấu trúc phân cấp được nhiều người biết đến nhất trong lĩnh vực SEO chính là Cấu trúc Silo. Trước khi tìm hiểu sâu hơn, hãy cùng làm rõ lại một số định nghĩa. Không giống như những gì bạn có thể đã đọc được qua các bài viết về cấu trúc website, hai khái niệm “silo” và “category” không đồng nghĩa với nhau. Trong lĩnh vực IA và các ngành khoa học thông tin, chúng có ý nghĩa khác nhau. Theo định nghĩa từ từ điển Merriam-Webster, một “category” (danh mục) là “một bộ phận được phân chia trong một hệ thống phân loại”. Các thành phần bên trong một danh mục phải có những đặc điểm chung cụ thể. Ngược lại, trên một website, một silo là một tập hợp lưu trữ các nội dung mà chỉ có thể được tiếp cận từ một danh mục cụ thể. Các nội dung trong silo được tách biệt, hoặc phần lớn là tách biệt khỏi những nội dung khác có trên website. Các danh mục trên website có thể trở thành các silo, như trong biểu đồ minh họa trang bên. Tóm lại, một danh mục không phải là một SILO. Tuy nhiên, các nội dung bên trong một danh mục có thể được cấu trúc thành một silo. Thực tế thì, cấu trúc SILO là một hệ thống phân cấp hiệu quả, bởi vì nó giúp cho các máy tìm kiếm hình thành nên các mối liên kết về sự liên quan (relevance). Nhưng qua hàng tá lần cập thật thuật toán cốt lõi, cùng với hàng trăm, thậm chí là hàng ngàn lần thay đổi nhỏ khác trong hệ thống thuật toán... thì Google có thể không cần đến một cấu trúc website hoàn toàn chặt chẽ mới có thể xác định mức độ liên quan nữa. Do vậy, không phải lúc nào Silo cũng là cấu trúc tốt nhất, đặc biệt là với nhiều loại website với các quy mô khác nhau. Cấu trúc phân cấp vẫn hiệu quả hơn so với các loại cấu trúc khác trong lĩnh vực tìm kiếm. Nhưng với sự thay đổi trong bối cảnh của hệ thống tìm kiếm hiện nay cùng với khả năng hiểu được sự liên quan thông qua nội dung chúng ta trình bày ngày càng hoàn thiện đã làm cho Silo không phải là cấu trúc duy nhất mang lại hiệu quả. Tóm lại, có một số quan điểm cần làm rõ sau đây: • Cấu trúc website rất quan trọng. • Hệ thống phân cấp là cách thức phân loại và tổ chức nội dung hiệu quả nhất (đối với phần lớn các website). • Có nhiều cách khác nhau để xây dựng được cấu trúc phân cấp (Hierarchical Structure). 4. Cấu trúc Nabla Hệ thống phân cấp thông tin (Information Hierarchy) là chủ đề được nghiên cứu ở các trường cao đẳng và đại học trên toàn thế giới, bởi các sinh viên thuộc nhiều ngành khác nhau. Một minh họa về mô hình kim tự tháp ngược Nabla (Nguồn: The Confident Teacher) Trong các trường đào tạo về báo chí, các sinh viên được hướng dẫn cấu trúc thông tin của họ theo một trật tự sao cho các thông tin quan trong hoặc có liên quan nhất sẽ được đặt ở nơi dễ tiếp cận nhất. Khi đề cập đến loại hình hệ thống phân cấp thông tin này, họ phát hiện rằng cấu trúc “kim tự tháp ngược” (Nabla) sẽ mang lại hiệu quả tốt nhất. • Ở mức độ vĩ mô – đó có thể là cấu trúc website. • Ở mức độ vi mô – đó có thể là các bài viết. Đối với website thì, phần lớn những người làm SEO đều đang làm ngược lại (áp dụng cấu trúc Silo). Silo có thể hiệu quả đối với việc xếp hạng tại một thời điểm nào đó, nhưng cũng có nhiều ý kiến trái chiều xoay quanh việc liệu nó có thực sự hiệu quả đối với các nội dung trên website không. Khoảng thời gian để thu hút sự chú ý của người dùng (attention- spans) đang giảm xuống, tầm quan trọng của các chỉ số liên quan đến tương tác của người dùng (user-engagement) ngày càng tăng lên. Và khi đề cập đến hoạt động tìm kiếm, có vẻ như các vấn đề liên quan đến việc thu thập dữ liệu (crawl issue) đang trở nên quan trọng hơn bao giờ hết, phần lớn trong số đó đặt vấn đề ngược lại về cách mà website của bạn được xây dựng và cũng như những mặt hạn chế của cấu trúc Silo. a. Những nền tảng của cấu trúc Nabla Cấu trúc rộng và nông Bạn nên xây dựng một cấu trúc “nông” (ít tầng) hơn là một cấu trúc sâu (có nhiều tầng). Để đạt được mục tiêu này thì việc có nhiều danh mục hơn (ít đi các danh mục con) sẽ hiệu quả hơn là chỉ có một vài danh mục với nhiều danh mục con trong đó. Tóm lại: Hãy xây dựng website theo chiều ngang, thay vì chiều dọc. Đưa các trang/bài viết vào bên dưới danh mục cụ thể Việc quan trọng trước tiên là hãy tạo ra các danh mục phù hợp, sau đó đưa nội dung vào trong những danh mục tương ứng. Hãy phân loại các nội dung một cách rõ ràng và có liên quan về mặt ngữ nghĩa nhất có thể. Ngoài ra, luôn đảm bảo là bạn tạo ra những danh mục chính xác và độc lập, không mâu thuẫn với nhau. Hãy tạo ra một danh mục mới thay vì đưa nội dung đó vào sai danh mục.