想知道公園游客關心什么,哪種分析方法更合適?
注:本文為刪減版,不可直接引用。原中英文全文刊發于《景觀設計學》(Landscape Architecture Frontiers)2023年第5期。獲取全文免費下載鏈接請點擊https://journal.hep.com.cn/laf/EN/10.15302/J-LAF-1-020083;參考引用格式見文末。
導 讀
互聯網科技和媒體的蓬勃發展產生了大量社交媒體數據,本研究嘗試開展社交媒體文本數據分析方法的對比研究,并揭示其在公園感知研究中的優缺點和適用性。研究選擇在相關領域廣泛應用的詞典模型和LDA模型,以大眾點評網站上北京10座城市公園的點評文本為研究數據,分別從單個公園和公園整體使用感知兩個層面進行文本分析,并對比分析感知主題的分類結果。結果表明:詞典模型更有利于在公園間進行橫向對比分析;LDA模型則可以直觀顯示公園特色和游客感知偏好;綜合運用兩種模型可優化公園感知評估。兩種方法揭示了北京城市公園游客對公園的關注主要集中于社交活動的需求、自然景觀帶來的視覺審美需求,以及交通設施狀況和城市公園消費情況。本研究既可為社交媒體文本分析方法的選擇和使用提供優化建議,又可為公園建設與管理改進提供依據與指導。
關鍵詞
社會感知;文本分析;詞典;隱含狄利克雷分布(LDA);城市公園;景觀感知
社交媒體文本數據分析方法對比與適用性研究:以北京市城市公園感知為例
Comparison and Applicability Study of Analysis Methods for Social Media Text Data:
Taking Perception of Urban Parks in Beijing as an Example
尚珍宇,程可欣,簡鈺清,王志芳
北京大學建筑與景觀設計學院
01 引言
隨著互聯網科技的高速發展,海量網絡媒體信息為社會感知的研究提供了數據基礎。這類研究早期多集中在通過簽到數據識別到訪率和動機偏好分析,以及結合照片圖像內容及其地理位置進行的感知情緒分析。近年來,通過文本數據挖掘進行感知分析的研究也開始起步并日漸增多。通過文本數據進行公園感知研究正逐漸受到學者們的關注。目前已經可以通過建立文本分析模型來挖掘文本所呈現的內在規律及主題,主題模型的運用開始成為感知分析和滿意度評價的基礎。已有研究在感知分析時,通常單獨采用其中一種模型進行文本數據處理,鮮少探討不同模型之間的優劣及專業適用性。
本研究嘗試開展社交媒體文本數據分析方法的對比研究,并揭示其在公園感知研究中的適用性。由于基于詞典規則的分類分析模型(下文簡稱“詞典模型”)和LDA模型在風景名勝區和城市公園感知研究中應用廣泛,本研究針對二者展開對比分析。本研究聚焦于以下問題:在對基于公園感知的社交媒體文本進行分析時,詞典模型和LDA模型的感知研究過程與分析結果存在怎樣的差異?兩種模型的優劣是什么?此基礎上,研究團隊進一步探究如何利用兩種模型的優勢為城市公園規劃提供指導,并總結文本分析方法在公園感知研究中的適用價值。
02 數據處理與研究方法
研究區域概況與數據來源
北京市市域擁有各類公園1050個,公園綠地面積累計達357.2km2。本研究選擇大眾點評網作為文本數據來源,使用Python軟件中的Request模塊獲取北京市公園目錄下自2006年4月至2020年9月的所有文字點評數據和點評者信息,選取點評數量排名前10位的城市公園作為研究對象(表1)。
為保證模型分析的準確性,研究對數據進行了預處理,僅保留字符數大于50的文本數據。篩選后評價數量最少的公園為北京園博園(6531條),以此為標準使用SPSS分別對其他各個公園的評價數據進行完全隨機抽樣,最終獲得65310條點評文本數據。研究選用Python語言工具jieba分詞對數據進行分詞。清洗文本數據進并進行同義詞替換。根據實際使用情況,人工篩查及調整分詞和同義詞替換結果,還原不恰當的同義詞替換內容。
研究方法
基于詞典的感知主題分類模型
詞典模型采用王志芳等人于2021年提出的基于景觀服務的城市公園感知主題分類評估模型,該模型經過詞典有效性檢驗,整體性能測試結果優良。在本研究中,運用Python對預處理后的數據進行結構化處理并提取高頻詞;之后進行人工分類,構建中文景觀服務感知詞典;繼而利用Word2vec和人工添加的方式擴建詞典內容,并劃分到不同的感知主題類別中。根據已有的文獻研究,共劃分出9類含義不同的公園景觀服務感知主題(表2)。
將獲取的公園感知評價文本數據與詞典進行匹配,以此識別評價數據中的用詞,進而提取出單條評價中所涉及的感知主題計算各類主題的感知頻率。將涉及某項感知主題的評論數量與總評論數量的比值作為相應景觀服務主題在該公園的感知頻率。
基于LDA的感知主題分類模型
LDA是一種通過計算機來自動分析文本的語言處理模型,能夠快速從非結構化文本(即文檔)中提煉出主題。LDA模型可以計算“文檔-主題”和“主題-詞語”兩類概率分布,從而實現對文檔主題和對應詞語(關鍵詞)的分類。
本研究使用Python軟件的gensim工具包調用LDA模型,實現文本數據主題分析。本研究中的主題數量主要通過計算主題一致性得分來確定,最后結合人工對一致性得分較高的主題進行篩選,確定合適的主題數量以獲得理想的模型運算結果。獲得結果后,對于每個主題的實際權重進行計算。針對每個公園的結果,分別進行主題命名,同時去除權重較低且感知內容相關性較弱的主題,即“噪聲”主題。
主題分布相關性分析
對兩種模型得到的不同感知主題的分布進行相關性分析。不同感知主題在每條評價文本中的分布情況為二分類變量,結果為“是”/“否”(分別記為“1”/“0”)兩項,因此在SPSS軟件中計算Phi系數,進行相關性檢驗。
主題內容語義分析
本研究使用Python對評價文本進行詞頻分析,通過詞云圖表達不同文本數據中被使用者提及頻次較高的詞語內容,以獲取各公園的感知主題內容。
技術路線
本研究基于北京市10座城市公園的大眾點評評價文本數據,利用兩種模型分別從單個公園和公園整體使用感知兩個層面進行文本分析,并對比分析感知主題的分類結果。
研究技術路線圖 ? 尚珍宇,程可欣,簡鈺清,王志芳
03 研究結果與分析
詞典模型更適用于公園間橫向對比
詞典模型分類統計結果顯示,游客對各公園不同主題的感知頻率存在明顯差異:圓明園遺址公園和奧林匹克森林公園的感知總頻率最高,北京世界公園與朝陽公園的感知總頻率相對較低;奧林匹克森林公園不同主題間感知頻率差異最大。此外,在不同公園中,娛樂活動和美學欣賞均表現出較高的游客感知頻率,教育價值和宗教信仰的感知頻率普遍較低。圓明園遺址公園在歷史文化方面的感知頻率、八大處公園在宗教信仰方面的感知頻率、景山公園的美學欣賞感知頻率、朝陽公園的社會交往感知頻率明顯高于其他公園。除此之外,玉淵潭公園和八大處公園的教育價值感知關注度相較于其他公園有所不足。
詞典模型下各公園不同主題的感知頻率差異圖 ? 尚珍宇,程可欣,簡鈺清,王志芳
LDA模型突出公園自身特色
由LDA模型下的感知分析結果可知,北京市10座城市公園的感知類型差異明顯,社交媒體評價突出體現了公園自身的景觀特色和游客感知偏好。通過表3可以看出,不同公園游客感知的主題數量普遍被分為8或9項,其中圓明園遺址公園、玉淵潭公園和奧林匹克森林公園的感知主題較多,北京世界公園最少。在感知內容上公園間存在差異,但部分主題在多數公園中均有體現。除此之外,部分感知主題因公園自身的特色表現出不同。同時,節慶活動在不同公園中也會產生獨特的游客感知。
玉淵潭公園主題詞云圖 ? 尚珍宇,程可欣,簡鈺清,王志芳
香山公園主題詞云圖 ? 尚珍宇,程可欣,簡鈺清,王志芳
將10座公園的所有評論文本數據進行LDA模型分析,結果顯示,感知主題可劃分為10項,其中交通門票、春季景觀、記憶感知和社交活動的感知頻率高于其他主題,登山活動、人文歷史、集會表演、秋季景觀、宗教文化、特色建筑的感知頻率相對較低。由此可見,北京城市公園游客對公園的關注主要集中于社交活動的需求、自然景觀帶來的視覺審美需求,以及交通設施狀況和城市公園消費情況。
香山公園秋景 ? 徐焰
詞典模型與LDA模型分析的共性與差異
兩種模型下不同感知主題共性分析
綜合分析結果可以看出北京城市公園游客主要關注社交游憩需求和自然景觀帶來的視覺審美需求是否得到滿足,同時對交通設施狀況和城市公園消費情況較為敏感?;谠~典模型的9項感知主題和LDA模型的10項感知主題在評價中的分布具有一定的相關性,主題分布相關性較強的有:春季景觀與環境改善、生物多樣性、娛樂活動和美學欣賞;宗教文化與歷史文化、宗教信仰;登山活動與宗教信仰;秋季景觀與美學欣賞;社交活動與娛樂活動、社會交往;記憶感知與教育價值;人文歷史與歷史文化、美學欣賞和教育價值。除此之外,詞典模型下的身心修復主題,以及LDA模型下的交通門票、特色建筑及集會表演主題與其他感知主題的分布相關性都較弱。
兩種模型下不同感知主題相關性?;鶊D ? 尚珍宇,程可欣,簡鈺清,王志芳
兩種模型感知內容分類的結果均表現出對自然景觀、人文歷史景觀和娛樂活動的關注。此外,LDA模型的分類結果更側重于對不同自然景觀和游覽活動的綜合感知;同時,將娛樂活動劃分為更具體的主題。相比于詞典模型清晰的感知主題劃分,LDA模型的分析結果界限相對模糊。
兩種模型下不同主題感知內容差異分析
兩種模型下的游客感知主題類型在不同公園的表現存在明顯差異。在單個公園的分析中所獲取的感知主題類型存在明顯差異。LDA模型提煉出的感知主題在不同公園中體現的內容各有不同,例如祭拜活動和登山活動等主題僅在個別公園中有所呈現;幾乎未能呈現低頻感知的內容;主題更加突出公園自身的特色,類型更加細分,且存在部分詞典模型未涉及的感知內容。相比之下,詞典模型則能夠捕捉到所有設定的感知內容。感知主題與涵蓋內容受現有詞典的影響,分類分析結果更加注重游客對人工選定的不同景觀服務內容的感知,識別到的對周邊環境和景觀要素的感知較少。
圓明園遺址公園 ? 徐焰
04 討論
兩種模型在公園感知文本分析中的優缺點
通過對比分析可以看出,基于詞典模型和LDA模型的城市公園感知分析在主題類型劃分上具有顯著差異??蓮墓珗@感知類型劃分、感知內容識別及模型適用范圍梳理兩種方法的具體優缺點(表4)。
兩種模型相結合的應用建議
在模型優化方面,可以基于LDA分析結果對詞典模型的詞典內容進行擴充、完善。在模型專業適用性方面,可以結合兩者特點和優勢來判斷結合應用的途徑。進行區域尺度的公園感知分析時,可先利用詞典模型進行現狀分析,為公園的建設、管理和改進提供依據;再選定需要深入挖掘的感知類型,通過LDA模型進行具體的文本分析,細化公園感知內容。對于單個公園進行感知分析時,可以基于LDA模型的結果確定公園的特色和游客的關注內容,再據此優化詞典模型并展開進一步分析,以期更加全面地發現問題。
05 結語
本研究選擇了兩種最常用的文本主題分析模型——詞典模型與LDA模型,對相同的研究對象進行分析,探討兩種模型的應用在城市公園感知研究中的差異,以明確其優缺點和優化途徑。研究結果不僅對城市公園的建設和管理具有指導性價值,也有利于推進通過文本分析進行社會感知的相關研究發展。
本研究仍存在一定的局限性。在數據來源方面,來自大眾點評網站的評價文本缺乏使用者的個人信息,無法進行有效的用戶畫像分析,分析結果難以全面體現城市公園游客感知情況。此外,LDA模型作為傳統的無監督分類模型,無法把控分類結果。針對LDA模型問題目前已有改進的涉及半監督和有監督的機器學習主題分類模型,有待進一步探究。最后,除了本文所探究的兩種模型外,基于大數據的文本分類模型還有多種,不同的模型算法具有各自的優勢和不足,后續研究也需要結合更多模型進行進一步的深化和驗證。
參考文獻
[1] Ferreira, A. P., Silva, T. H., & Loureiro, A. A. (2020). Uncovering spatiotemporal and semantic aspects of tourists mobility using social sensing. Computer Communications, (160), 240?252.
[2] Li, Y., Guo, J., & Chen, Y. (2022). A new approach for tourists’ visual behavior patterns and perception evaluation based on multi-source data. Journal of Geo-information Science, 24(10), 2004?2020.
[3] Liu, Y., Liu, X., Gao, S., Gong, L., Kang, C., Zhi, Y., Chi, G., & Shi, L. (2015). Social sensing: A new approach to understanding our socioeconomic environments. Annals of the Association of American Geographers, 105(3), 512?530.
[4] Liu, Y. (2016). Revisiting several basic geographical concepts: A social sensing perspective. Acta Geographica Sinica, 71(4), 564?575.
[5] Mao, T., Wu, Y., & Huang, W. (2023). Content mining and sentiment analysis of online comments for ethnic museums in autonomous regions. Economic Geography, 43(8), 229?236.
[6] He, X. (2019). Research on Social Sensing and Spatiotemporal Pattern of Xiong’an New District Based on Weibo Data [Master’s thesis]. Hebei Normal University.
[7] Zhang, S., & Zhou, W. (2018). Recreational visits to urban parks and factors affecting park visits: Evidence from geotagged social media data. Landscape and Urban Planning, (180), 27?35.
[8] Donahue, M. L., Keeler, B. L., Wood, S. A., Fisher, D. M., Hamstead, Z. A., & McPhearson, T. (2018). Using social media to understand drivers of urban park visitation in the Twin Cities, MN. Landscape and Urban Planning, (175), 1?10.
[9] Li, F., Li, F., Li, S., & Long, Y. (2019). Deciphering the recreational use of urban parks: Experiments using multi-source big data for all Chinese cities. Science of the Total Environment, (701), 134896.
[10] Liang, H., & Zhang, Q. (2021). Temporal and spatial assessment of urban park visits from multiple social media data sets: A case study of Shanghai, China. Journal of Cleaner Production, (297), 126682.
[11] Van Berkel, D. B., Tabrizian, P., Dorning, M. A., Smart, L., Newcomb, D., Mehaffey, M., Neale, A., & Meentemeyer, R. K. (2018). Quantifying the visual-sensory landscape qualities that contribute to cultural ecosystem services using social media and LiDAR. Ecosystem services, (31), 326?335.
[12] Oteros-Rozas, E., Martín-López, B., Fagerholm, N., Bieling, C., & Plieninger, T. (2018). Using social media photos to explore the relation between cultural ecosystem services and landscape features across five European sites. Ecological Indicators, (94), 74?86.
[13] Richards, D. R., & Friess, D. A. (2015). A rapid indicator of cultural ecosystem service usage at a fine spatial scale: Content analysis of social media photographs. Ecological Indicators, (53), 187?195.
[14] Pan, Y., & Li, J. (2021). Landscape preference based on user-generated photograph metadata: The case of Xixi National Wetland Park. Natural Protected Areas, (1), 100?108.
[15] Zhu, X., Gao, M., Zhang, R., & Zhang, B. (2021). Quantifying emotional differences in urban green spaces extracted from photos on social networking sites: A study of 34 parks in three cities in northern China. Urban Forestry & Urban Greening, (62), 127133.
[16] Wartmann, F. M., Acheson, E., & Purves, R. S. (2018). Describing and comparing landscapes using tags, texts, and free lists: An interdisciplinary approach. International Journal of Geographical Information Science, 32(8), 1572?1592.
[17] Yan, Y., Chen, J., & Wang, Z. (2020). Mining public sentiments and perspectives from geotagged social media data for appraising the post-earthquake recovery of tourism destinations. Applied Geography, (123), 102306.
[18] Marcotte, C., & Stokowski, P. A. (2021). Place meanings and national parks: A rhetorical analysis of social media texts. Journal of Outdoor Recreation and Tourism, (35), 100383.
[19] Bai, H., Song, Z., Liang, S., Zhang, P., & Zhang, G. (2023). Imagery perception analysis and comprehensive attraction evaluation of tourism destinations based on Internet text data—Taking Nanjing City as example. Areal Research and Development, 42(4), 89–94.
[20] Zhao, Y., Pang, S., & Wu, Z. (2021). Research on geographic semantic ontology model based on social sensing data for emergency management of events. Information Science, (2), 44?53.
[21] Chen, Y., Gong, C., Fan, Y., Li, X., Liang, Y., & Hu, M. (2022). Spatio-temporal variation assessment of urban waterlogging in Zhengzhou using social media data. Journal of China Hydrology, 42(3), 26, 48?52.
[22] Li, S., Zhao, F., Zhou, Y., Tian, X., & Huang, H. (2022). Analysis of public opinion and disaster loss estimates from typhoons based on Microblog data. Journal of Tsinghua University (Science and Technology), 62(1), 43?51.
[23] Yang, B., & Zhang, J. (2017). Research on tourism image and perception of Tianmu Mountain based on network text analysis—Based on travel notes and comments of Ctrip. Journal of Fujian Forestry Science and Technology, 44(4), 118?125.
[24] Wang, X., & Xia, M. (2018). Research on tourist preference and satisfaction in Huangshan Scenic Spot based on network review data. Tourism Overview, (18), 59?60.
[25] Wight, A. C. (2020). Visitor perceptions of European Holocaust Heritage: A social media analysis. Tourism Management, (81), 104142.
[26] Xu, Z., Dong, J., Chen, Z., Fu, W., Wang, M., & Dong, J. (2021). Image Perception of the historical ancient town scenic spot of Yunshuiyao. Journal of Chinese Urban Forestry, 19(2), 115?120.
[27] Park, S. B., Kim, J., Lee, Y. K., & Ok, C. M. (2020). Visualizing theme park visitors’ emotions using social media analytics and geospatial analytics. Tourism Management, (80), 104127.
[28] Widmar, N. O., Bir, C., Clifford, M., & Slipchenko, N. (2020). Social media sentimentas an additional performance measure? Examples from iconic theme park destinations. Journal of Retailing and Consumer Services, (56), 102157.
[29] Wan, C., Shen, G. Q., & Choi, S. (2021). Eliciting users’ preferences and values in urban parks: Evidence from analyzing social media data from Hong Kong. Urban Forestry & Urban Greening, (62), 127172.
[30] Li, L., Zhang, C., Han, L., Qing, L., & Ji, H. (2021). Research on multi-scale evaluation system of parks based on comment text—Taking Chengdu parks as an example. Intelligent City, (2), 3?6.
[31] Jiang, Q., Wang, G., Liang, X., & Liu, N. (2022). Research on the perception of cultural ecosystem services in urban parks via analyses of online comment data. Landscape Architecture Frontiers, 10(5), 32?51.
[32] Jing, F., Sun, H., & Long, D. (2017). Tourist experience elements structure characteristics analysis of Xixi National Wetland Park based on web text. Journal of Zhejiang University (Science Edition), 44(5), 623?630.
[33] Wang, X., & Li, X. (2017). Research on the analysis of social services value of forest park in Beijing based on network big data. Chinese Landscape Architecture, (10), 14?18.
[34] Zhao, S., & Liu, B. (2019). Research on visitor perception of urban parks based on analysis of network text data—Take the main urban area of Nanjing as an example. 2019 Urban Development and Planning Proceedings (pp. 263?272). Chinese Society for Urban Studies.
[35] Gao, X., Jin, Y., Wang, X., & Hao, J. (2021). Research on product perceptual evaluation method based on online review mining. Modern Manufacturing Engineering, (12), 13?20.
[36] Lu, X. (2014). Research on text clustering algorithm based on K-means. Computer Programming Skills & Maintenance, (24), 33?35.
[37] Wang, D., Li, J., & Shi, Y. (2020). Methods of government document clustering based on K-means algorithm. Software Guide, 19(6), 201?204.
[38] Ma, W., Chen, G., Li, X., Su, W., Chai, Y., Pu, Y., Zeng, J., & Liu, X. (2021). Chinese comment classification based on Naive Bayesian algorithm. Journal of Computer Applications, 41(S2), 31?35.
[39] Permana, F. C., Rosmansyah, Y., & Abdullah, A. S. (2017). Naive Bayes as opinion classifier to evaluate students satisfaction based on student sentiment in Twitter social media. Journal of Physics: Conference Series, (893), 012051.
[40] Han, X., & Li, Y. (2022). Research on the influencing factors of social media rumor-refuting information dissemination effect in emergencies. Information Studies: Theory & Application, 45(8), 97?103.
[41] Zeng, Y., Li, Z., & Zhou, Y. (2020). Article feature extraction and flow control based on text mining. Electronic Technology & Software Engineering, (2), 176?177.
[42] Wang, Z., Miao, Y., Xu, M., Zhu, Z., Qureshi, S., & Chang, Q. (2021). Revealing the differences of urban parks’ services to human wellbeing based upon social media data. Urban Forestry & Urban Greening, (63), 127233.
[43] Wang, Z., Zhu, Z., Xu, M., & Qureshi, S. (2021). Fine-grained assessment of greenspace satisfaction at regional scale using content analysis of social media and machine learning. Science of the Total Environment, (776), 145908.
[44] Zheng, T., Yan, Y., Zhang, W., Zhu, J., Wang, C., Rong, Y., & Lu, H. (2022). Landscape assessment on urban parks using social media data. Acta Ecologica Sinica, 42(2), 561?568.
[45] Taecharungroj, V., & Mathayomchan, B. (2019). Analysing TripAdvisor reviews of tourist attractions in Phuket, Thailand. Tourism Management, (75), 550?568.
[46] Dong, S., & Wang, Q. (2019). LDA-based tourist perception dimension recognition: Research framework and empirical research—Taking the National Mine Park as an example. Journal of Beijing Union University (Humanities and Social Sciences), 17(2), 42?49.
[47] Liang, C., & Li, R. (2020). Tourism destination image perception analysis based on the Latent Dirichlet Allocation model and dominant semantic dimensions: A case of the Old Town of Lijiang. Progress in Geography, 39(4), 614?626.
[48] Song, Y., Wang, R., Fernandez, J., & Li, D. (2021). Investigating sense of place of the Las Vegas Strip using online reviews and machine learning approaches. Landscape and Urban Planning, (205), 103956.
[49] Zhou, W. (2021) Research on Tourism Destination Evaluation Based on Improved AHP of LDA: A Case Study of 5A Scenic Spots in Jiangxi Province [Master’s thesis]. Jiangxi University of Finance and Economics.
[50] Beijing Statistics Bureau. (2021). Beijing statistics yearbook. China Statistics Press.
[51] Zhu, Z. (2020). An Assessment Framework of Green Space Satisfaction Using Social Media Data: Content Analysis with Machine Learning [Master’s thesis]. Peking University.
[52] Wang, Z., Miao, Y., Zhu, Z., Zhou, J., & Wang, S. (2020). A method for landscape service identification of parks (No. CN111310444A). China National Intellectual Property Administration.
[53] Buchel, S., & Frantzeskaki, N. (2015). Citizens’ voice: A case study about perceived ecosystem services by urban park users in Rotterdam, the Netherlands. Ecosystem Services, (12), 169?177.
[54] Huang, S., Pearce, J., Wen, J., Dowling, R. K., & Smith, A. J. (2020). Segmenting Western Australian national park visitors by perceived benefits: A factor-item mixed approach. International Journal of Tourism Research, 22(6), 814?824.
[55] Willemen, L., Verburg, P. H., Hein, L., & van Mensvoort, M. E. (2008). Spatial characterization of landscape functions. Landscape and Urban Planning, 88(1), 34?43.
[56] Sun, R., Li, F., & Chen, L. (2019). A demand index for recreational ecosystem services associated with urban parks in Beijing, China. Journal of Environmental Management, (251), 109612.
[57] van Riper, C. J., Kyle, G. T., Sutton, S. G., Barnes, M., & Sherrouse, B. C. (2012). Mapping outdoor recreationists’ perceived social values for ecosystem services at Hinchinbrook Island National Park, Australia. Applied Geography, 35(1?2), 164?173.
[58] Wang, J., Wang, M., & Du, B. (2019). A study of the change trend of social concern in the field of consumption in China—The LDA Model analysis based on the text of Daily Economic News List in People’s Daily Online (2007—2017). Journal of Baoding University, 32(2), 41?49.
[59] Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent Dirichlet allocation. Journal of Machine Learning Research, (3), 993?1022.
[60] Brandt, T., Bendler, J., & Neumann, D. (2017). Social media analytics and value creation in urban smart tourism ecosystems. Information & Management, 54(6), 703?713.
[61] R?der, M., Both, A., & Hinneburg, A. (2015). Exploring the Space of Topic Coherence Measures. Proceedings of the Eighth ACM International Conference on Web Search and Data Mining (pp. 399?408). Association for Computing Machinery.
[62] Stevens, K., Kegelmeyer, P., Andrzejewski, D., & Buttler, D. (2012). Exploring Topic Coherence over Many Models and Many Topics. Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (pp. 952?961). Association for Computational Linguistics.
[63] Syed, S., & Weber, C. T. (2018). Using machine learning to uncover latent research topics in fishery models. Reviews in Fisheries Science & Aquaculture, 26(3), 319?336.
[64] Chen, Y., Zhu, Y., & Fu, G. (2022). Visitor perception toward outstanding universal value of Xinjiang Tianshan—Based on web text analysis. Special Zone Economy, 398(3), 124?128.
[65] Liu, Q., Wang, X., & Liu, J. (2022). Study on relationship among tourist perceived value, satisfaction and environmental responsibility behavior in forest park. Ecological Economy, 38(2), 137?141.
[66] Cao, K., & Chen, Y. (2021). Service evaluation of Shenzhen parks based on social data. Special Zone Economy, (4), 127?129.
[67] Ye, Y., & Qiu, H. (2022). Urban park image perception based on network text analysis. Journal of Chinese Urban Forestry, 20(1), 90?95.
[68] Han, D., Wang, C., & Xiao, M. (2018). Text categorization scheme based on semi-supervised learning and Latent Dirichlet allocation model. Computer Engineering and Design, 39(10), 3265?3271.
[69] Guo, X., Ding, J., Jiang, H., & Chen, Z. (2020). ZeroNet text content analysis based on semi-supervised LDA topic model. Information Technology, (3), 32?38.
本文引用格式 / PLEASE CITE THIS ARTICLE AS
Shang, Z., Cheng, K., Jian, Y., & Wang, Z. (2023). Comparison and applicability study of analysis methods for social media text data: Taking perception of urban parks in Beijing as an example. Landscape Architecture Frontiers, 11(5), 8?29. https://doi.org/10.15302/J-LAF-1-020083
封面圖片 ? 陳燕華
編輯 | 王穎,周佳怡
翻譯 | 王穎,尚珍宇,周佳怡
版權聲明:本文版權歸原作者所有,請勿以景觀中國編輯版本轉載。如有侵犯您的權益請及時聯系,我們將第一時間刪除。
投稿郵箱:info@www.jcycg.com
項目咨詢:18510568018(微信同號)