地點分類演算法

在 Styletrip 專案內,我們有提供行程規劃功能,能為使用者安排景點、餐飲和住宿,因此,我們必須要有景點、餐飲和住宿這三大類的資料。 然而當我們在抓地點資料的時候,不一定能明確知道一個地點是屬於哪一類,所以必須借助 Machine Learning 的 Classification 分類演算法來幫助我們做自動分類。

這邊我們使用到的訓練集合是各景點的部落格文章,演算法嘗試使用過 kNN 和 Bayes 分類演算法,跑出來的效果也有點不同。

styletrip_engine [~-Project-JavaProject-styletrip_engine] - ...-src-com-infinitibeat-engine-datasource-PlaceClassifyEngine.java [styletrip_engine] - IntelliJ IDEA_006
Bayes 演算法實做
「台北寒舍艾美酒店」分類為住宿

PlaceCategoryClassifyEngine.java - Eclipse _23:35

「鹿谷綠園茶舍民宿」分類為住宿宿,而景點分類分數也很高,表示該地點是民宿,也是景點。

螢幕擷圖存為 2014-11-05 16:09:48 (副本)

當然倚賴演算法不一定是100%準確,看下圖的結果

knn1

「珠珠小歇」是從美食網站抓來的,但是 kNN 演算法 n = 6 最鄰近的資料點卻判定為景點。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Blog at WordPress.com.

Up ↑