ExtractKeyword.com – Trích xuất và Phân tích Từ khóa Tiếng Việt

trong danh mục Web Programming

Extract & Analyze Keywords from Websites and Paragraphs | ExtractKeyword.com

Hi các bạn Web Developer, SEOer và Copywriter!

Mình rất vui mừng publish dự án ExtractKeyword.com nhằm hỗ trợ công việc của các bạn.
Extractkeyword.com là một dự án web hay cụ thể là 1 Web Service cung cấp 2 dịch vụ chính: Trích xuất từ khóaphân tích từ khóa từ 1 webpage hay một đoạn text của bạn.

1. Chức năng trích xuất từ khóa (Keyword Extractor) là chức năng cho phép chọn ra các từ khóa theo thứ tự ưu tiên dựa vào nội dung 1 webpage hay nội dung text.

2. Chức năng phân tích từ khóa (Keyword Analyzer) là chức năng nâng cao hơn của chức năng trích xuất, ngoài kết quả là các từ khóa, kết quả còn có chi tiết về từ khóa như Keyword Density, tần suất xuất hiện (bao nhiêu trong thẻ TITLE, thẻ H1, H2, A, STRONG…) để giúp bạn có chiến lược trong việc lựa chọn và phân tích từ khóa của mình.

Một đặc điểm đáng lưu ý so với các website dạng này của nước ngoài là hỗ trợ gần như hoàn toàn cho nội dung Tiếng Việt (tất nhiên là hỗ trợ Tiếng Anh) nên rất thích hợp để phân tích trang web hay văn bản Tiếng Việt.

—————————-
Dành cho Web Developer:

Mình chia sẽ một chút kỹ thuật trong quá trình coding ứng dụng này nếu có Coder nào quan tâm:

Website sử dụng 2 giải thuật chính để đưa ra các con số đó là :
a> Giải thuật tìm kiếm và đánh giá từ khóa : dựa trên trọng số của thẻ HTML cũng như tần suất từ khóa để tính trọng số của từ khóa. W = f(H, F, C, fA)
trong đó:
+ W: trọng số của 1 từ khóa
+ f(): hàm số tính trọng số
+ H: trọng số của thẻ HTML chứa từ khóa. VD: H của thẻ TITLE sẽ lớn hơn H của thẻ A…
+ F: Tần số xuất hiện từ khóa.
+ C: số từ của từ khóa. Website hỗ trợ các từ khóa có 1 từ, 2 từ, 3 từ và 4 từ.
+ fA: Hàm điều chỉnh để giải quyết 1 số trường hợp cụ thể cần can thiệp để điều chỉnh trọng số

b> Giải thuật tìm kiếm từ khóa từ 1 nội dung Text: Đây là giải thuật trung tâm của ứng dụng, sử dụng một nhánh nhỏ của môn “Xử lý ngôn ngữ tự nhiên” (Natural Language Processing) để tìm kiếm từ khóa. Hỗ trợ cả tiếng Anh (ngôn ngữ đơn âm) và tiếng Việt (ngôn ngữ đa âm –> phức tạp).

Trong thời gian sắp tới, mình sẽ open API để các bạn có thể tích hợp kết quả trích xuất và phân tích từ khóa vào ứng dụng của bạn theo thời gian thực. Dự kiến API này sẽ release vào ngày 6/9/2010 và sẽ FREE Signup cho các website.

Một số ví dụ ứng dụng tích hợp API là bạn có một site có nội dung gần như là tự động cập nhật từ nhiều nguồn, cần trích xuất từ khóa để thêm Tag cho nội dung thì sử dụng API để trích xuất tự động là hiệu quả. Hoặc các site có nội dung mà người dùng hầu như không cung cấp Tag, bạn có thể Request để lấy Tag từ nội dung và lưu lại.

Đây chỉ là 1 số ví dụ nhỏ mà mình nghĩ ra lúc này.Tuy nhiên với sức mạnh của API này, hy vọng nó sẽ giúp ích cho website của bạn ở những trường hợp khác.

Mình không dám chắc kết quả sẽ thõa mãn 100% nhu cầu của các bạn nhưng mình tin nó sẽ đáp ứng gần như hết các yêu cầu của bạn về từ khóa và tag.

Hãy sử dụng và cho mình ý kiến nhé, cảm ơn mọi người!

Enjoy Testing!

———-
P.S: I love Vietnamese!

8 bình luận

  1. Thuận says:

    Chương trình rất hữu ích.. Và sẽ hữu ích cho nhiều người hơn nếu được bạn share source code.
    Cảm ơn chương trình của bạn.

  2. Toàn says:

    Tôi đang tìm kiếm cái module này nên đã link đến website của bạn. Rất ấn tượng. Bạn có thể chia sẻ giải thuật tìm kiếm từ khóa?

    • admin says:

      Thuật toán chi tiết thì mình không thể share được, bạn cũng thông cảm. Những bài toán này bạn có thể search sách về xử lý ngôn ngữ tự nhiên, cách phân tích stopword, stemming…

      API của mình do ứng dụng trên nền web service nên không phân tích chính xác lắm vì không sử dụng từ điển để tra cứu mà chỉ đơn giản dựa vào stopword và tận dụng nền HTML tag để đánh trọng số.

      Chúc vui

  3. tranthe says:

    Anh ơi cái trang này làm sao vậy đi rồi. Kéo theo Plugin TagMaker cũng đi luôn theo nó. Vậy giờ phải làm sao để chạy Plugin đó đây ạ!

  4. tranthe says:

    Em đang dùng TagMaker cho mấy trang! http://extractkeyword.com/ trang này không thể chạy được nên thành ra TagMaker cũng ko chạy được anh ạ. Anh xem lại hoặc có thể gửi mail hướng dẫn em chạy mà ko cần API được không ạ. Thank anh

  5. hình như website dừng hoạt động rồi à bạn? mình không vào được.

Gởi bình luận