在 Styletrip 專案內,我們有提供行程規劃功能,能為使用者安排景點、餐飲和住宿,因此,我們必須要有景點、餐飲和住宿這三大類的資料。 然而當我們在抓地點資料的時候,不一定能明確知道一個地點是屬於哪一類,所以必須借助 Machine Learning 的 Classification 分類演算法來幫助我們做自動分類。
這邊我們使用到的訓練集合是各景點的部落格文章,演算法嘗試使用過 kNN 和 Bayes 分類演算法,跑出來的效果也有點不同。
「鹿谷綠園茶舍民宿」分類為住宿宿,而景點分類分數也很高,表示該地點是民宿,也是景點。
當然倚賴演算法不一定是100%準確,看下圖的結果
「珠珠小歇」是從美食網站抓來的,但是 kNN 演算法 n = 6 最鄰近的資料點卻判定為景點。
Leave a Reply