马蜂窝利用网络爬虫抓取抄袭其他平台真实评论的事件日益发酵。什么是网络爬虫?马蜂窝这个事件背后暴露了什么数据风险问题?数据风险问题该如何解决?近日,针对马蜂窝“数据造假”的文章刷屏网络。文章指出,马蜂窝万条真实点评中,有万条是通过机器人从点评、携程等其他平台抄袭而来。作者表示:在马蜂窝上发现了个抄袭账号,平均每个账号从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭万条餐饮点评,万条酒店点评。其实,不仅旅游网站遭到网络爬虫的恶意抓取,航空、视频等也是被恶意爬取的重灾区。今年2月,视频弹幕网站哔哩哔哩(bilibili)大量用户的视频、昵称、头像及用户评论,出现在某新成立的视频网站上,就是非法网络爬虫的盗取;而航空公司的
转载请注明:
http://www.aideyishus.com/lkcf/8206.html