ExtractKeyword.com – Trích xuất và Phân tích Từ khóa Tiếng Việt
Đăng trong danh mục Web Programming bởi admin | Tags: analyse keyword, api, extract keyword, extract tag, keyword, keyword analyzer, keyword extractor, keywords, phân tích từ khóa, tag, tag extractor, trích xuất từ khóa, từ khóa, từ khóa tiếng việt
Hi các bạn Web Developer, SEOer và Copywriter!
Mình rất vui mừng publish dự án ExtractKeyword.com nhằm hỗ trợ công việc của các bạn.
Extractkeyword.com là một dự án web hay cụ thể là 1 Web Service cung cấp 2 dịch vụ chính: Trích xuất từ khóa và phân tích từ khóa từ 1 webpage hay một đoạn text của bạn.
1. Chức năng trích xuất từ khóa (Keyword Extractor) là chức năng cho phép chọn ra các từ khóa theo thứ tự ưu tiên dựa vào nội dung 1 webpage hay nội dung text.
2. Chức năng phân tích từ khóa (Keyword Analyzer) là chức năng nâng cao hơn của chức năng trích xuất, ngoài kết quả là các từ khóa, kết quả còn có chi tiết về từ khóa như Keyword Density, tần suất xuất hiện (bao nhiêu trong thẻ TITLE, thẻ H1, H2, A, STRONG…) để giúp bạn có chiến lược trong việc lựa chọn và phân tích từ khóa của mình.
Một đặc điểm đáng lưu ý so với các website dạng này của nước ngoài là hỗ trợ gần như hoàn toàn cho nội dung Tiếng Việt (tất nhiên là hỗ trợ Tiếng Anh) nên rất thích hợp để phân tích trang web hay văn bản Tiếng Việt.
—————————-
Dành cho Web Developer:
Mình chia sẽ một chút kỹ thuật trong quá trình coding ứng dụng này nếu có Coder nào quan tâm:
Website sử dụng 2 giải thuật chính để đưa ra các con số đó là :
a> Giải thuật tìm kiếm và đánh giá từ khóa : dựa trên trọng số của thẻ HTML cũng như tần suất từ khóa để tính trọng số của từ khóa. W = f(H, F, C, fA)
trong đó:
+ W: trọng số của 1 từ khóa
+ f(): hàm số tính trọng số
+ H: trọng số của thẻ HTML chứa từ khóa. VD: H của thẻ TITLE sẽ lớn hơn H của thẻ A…
+ F: Tần số xuất hiện từ khóa.
+ C: số từ của từ khóa. Website hỗ trợ các từ khóa có 1 từ, 2 từ, 3 từ và 4 từ.
+ fA: Hàm điều chỉnh để giải quyết 1 số trường hợp cụ thể cần can thiệp để điều chỉnh trọng số
b> Giải thuật tìm kiếm từ khóa từ 1 nội dung Text: Đây là giải thuật trung tâm của ứng dụng, sử dụng một nhánh nhỏ của môn “Xử lý ngôn ngữ tự nhiên” (Natural Language Processing) để tìm kiếm từ khóa. Hỗ trợ cả tiếng Anh (ngôn ngữ đơn âm) và tiếng Việt (ngôn ngữ đa âm –> phức tạp).
Trong thời gian sắp tới, mình sẽ open API để các bạn có thể tích hợp kết quả trích xuất và phân tích từ khóa vào ứng dụng của bạn theo thời gian thực. Dự kiến API này sẽ release vào ngày 6/9/2010 và sẽ FREE Signup cho các website.
Một số ví dụ ứng dụng tích hợp API là bạn có một site có nội dung gần như là tự động cập nhật từ nhiều nguồn, cần trích xuất từ khóa để thêm Tag cho nội dung thì sử dụng API để trích xuất tự động là hiệu quả. Hoặc các site có nội dung mà người dùng hầu như không cung cấp Tag, bạn có thể Request để lấy Tag từ nội dung và lưu lại.
Đây chỉ là 1 số ví dụ nhỏ mà mình nghĩ ra lúc này.Tuy nhiên với sức mạnh của API này, hy vọng nó sẽ giúp ích cho website của bạn ở những trường hợp khác.
Mình không dám chắc kết quả sẽ thõa mãn 100% nhu cầu của các bạn nhưng mình tin nó sẽ đáp ứng gần như hết các yêu cầu của bạn về từ khóa và tag.
Hãy sử dụng và cho mình ý kiến nhé, cảm ơn mọi người!
Enjoy Testing!
———-
P.S: I love Vietnamese!
Bài viết liên quan:
7 Lời bình cho bài viết “ExtractKeyword.com – Trích xuất và Phân tích Từ khóa Tiếng Việt”
Viết lời bình
Bình luận mới nhất
- Karaoke Vietnam - Ứng dụng Android đầu tay
"Em cũng đang định làm 1 app. Anh có thể cho em vài gợi ý về server và" - thang - [Slide] Hội thảo: Heavy Web Optimization – Front-end
"Trên blog cá nhân của mình cũng có những bài viết cho việc tối ưu hóa " - TMQuang - phpmailer gởi mail SMTP bằng Gmail/Google Apps
"mình muốn đính kèm theo tập tin thì sao nhỉ" - Hòa - Mạng xã hội và thị trường Châu Á
"@admin, "Còn về mô hình “" - Dior - Lưu dữ liệu đa ngôn ngữ trong Database
"@viet_it_pro, cau truy " - viet_it_pro - Lưu dữ liệu đa ngôn ngữ trong Database
"@Quang Huỳnh, Bài bình luậ" - viet_it_pro - [Slide] Hội thảo: Heavy Web Optimization – Front-end
"Anh ơi cho em hỏi, làm thế nào để nhận mail google bằng php, anh có th" - Đặng Trung Kiên - Làm IT nên đọc ebook của nhà xuất bản nào?
"@Lê Hoàng Dũng, Mình thấy" - quang - Thư viện Khoa học tổng hợp TPHCM
"cảm ơn bài viết, mặc dù đã sinh sống ở Saigon khá lâu , nay mình mới c" - NHUNG - phpmailer gởi mail SMTP bằng Gmail/Google Apps
"Chào anh Tuấn, tut của anh em đã đọc, cảm ơn anh đã chia sẻ. Tuy nhiên" - Trần Đình Trọng
Danh mục
- android (2)
- Business (24)
- Flash (1)
- Graphic Design (16)
- IT Guys (1)
- Javascript (9)
- Miscellaneous (58)
- Photography (9)
- PHP (38)
- Review sách (13)
- Search Engine Optimization (2)
- security (2)
- software (5)
- User Interface Design & Usability (8)
- Web Design (28)
- Web Programming (48)
Lưu trữ
- February 2012 (1)
- January 2012 (1)
- December 2011 (1)
- November 2011 (2)
- September 2011 (2)
- August 2011 (1)
- July 2011 (4)
- June 2011 (2)
- May 2011 (2)
- April 2011 (2)
- March 2011 (2)
- February 2011 (2)
- January 2011 (4)
- December 2010 (6)
- November 2010 (3)
- October 2010 (3)
- September 2010 (5)
- August 2010 (6)
- July 2010 (5)
- June 2010 (2)
- May 2010 (5)
- April 2010 (7)
- March 2010 (8)
- February 2010 (4)
- January 2010 (10)
- December 2009 (12)
- November 2009 (12)
- October 2009 (15)
- September 2009 (16)
- August 2009 (11)
- July 2009 (15)
- November 2008 (1)
- October 2008 (1)
- September 2008 (3)


September 5, 2010 at 11:29 am
Chương trình rất hữu ích.. Và sẽ hữu ích cho nhiều người hơn nếu được bạn share source code.
Cảm ơn chương trình của bạn.
[Reply]
admin Reply:
September 5th, 2010 at 11:33 am
Thanks.
[Reply]
Sỹ Reply:
November 12th, 2010 at 10:35 am
Bạn có thể share tài liệu về phần này ko? Mình rất quan tâm. Thanks
[Reply]
November 12, 2010 at 10:14 pm
Tôi đang tìm kiếm cái module này nên đã link đến website của bạn. Rất ấn tượng. Bạn có thể chia sẻ giải thuật tìm kiếm từ khóa?
[Reply]
admin Reply:
November 12th, 2010 at 10:27 pm
Thuật toán chi tiết thì mình không thể share được, bạn cũng thông cảm. Những bài toán này bạn có thể search sách về xử lý ngôn ngữ tự nhiên, cách phân tích stopword, stemming…
API của mình do ứng dụng trên nền web service nên không phân tích chính xác lắm vì không sử dụng từ điển để tra cứu mà chỉ đơn giản dựa vào stopword và tận dụng nền HTML tag để đánh trọng số.
Chúc vui
[Reply]
August 28, 2011 at 11:23 pm
Anh ơi cái trang này làm sao vậy đi rồi. Kéo theo Plugin TagMaker cũng đi luôn theo nó. Vậy giờ phải làm sao để chạy Plugin đó đây ạ!
[Reply]
August 30, 2011 at 12:30 am
Em đang dùng TagMaker cho mấy trang! http://extractkeyword.com/ trang này không thể chạy được nên thành ra TagMaker cũng ko chạy được anh ạ. Anh xem lại hoặc có thể gửi mail hướng dẫn em chạy mà ko cần API được không ạ. Thank anh
[Reply]