最近,在对AIW全智通应用机器人的研究中,我们发现了一个令人担忧的现象。这个机器人的一个主要功能是阅读指定的互联网内容,但现在越来越多的内容无法被它阅读。尽管我们不断为AIW全智通加入更多模拟人类工作时的技能,但由于它无法访问这些网站,它在工作时所能参考的资料越来越少,使得这一技能被客观地弱化了。
根据Originality.AI的最新数据,全球排名前1000的网站中,近20%已经开始阻止爬取其网页数据的爬虫机器人。这些机器人的主要任务是为AI服务收集网页数据。这种现象背后的原因是什么呢?表面上看,这似乎与人们对隐私和数据权益的关注有关。但深入挖掘后,我们发现更深层的原因是商业博弈。许多网站开始担心他们的流量会被人工智能应用所截留。尤其是大型新闻网站如纽约时报、路透社和CNN等,他们对此表示担忧并开始采取措施限制AI爬虫的访问。
但为什么会有这样的担忧呢?许多网站、尤其是新闻网站,认为Google和其他搜索引擎的数据爬虫是合理的,因为这可以带来用户流量,从而带来广告收入。但在AI时代,这种价值观发生了改变。出版商和知识产权持有者开始更加激进地阻止AI爬虫,因为他们看不到将数据交给AI公司的好处。许多媒体公司目前正在与AI公司商讨为其提供数据的收费协议,但这些谈判仍处于早期阶段。此外,还有一些网站和知识产权持有者正在采取或考虑对可能未经许可使用其数据的AI公司采取法律行动。
对于这个问题,我认为信息或数据类的网站应该思考如何与AI共生。他们可以开放收费的数据接口或为爬虫制定收费协议,使机器AI能够更好地阅读内容。这样,不仅可以保证他们的商业利益,还可以推动AI的发展,为全人类创造更大的价值。传统的信息或数据类网站,应该做好人工智能时代的数据服务,开放收费的数据接口或是用于爬虫的收费协议,来实现和帮助机器AI更好的阅读,而不是封锁。一起推进AI时代的发展,这样对全世界、全人类的发展才是有利的。
在这个问题上,我们还有很长的路要走。但我相信,只要我们能够放下成见,共同努力,一定可以找到一个双赢的解决方案。
广州企元大数据科技有限公司,专注于人工智能企业应用,为企业提供内部专属的人工智能模型开发、生成式AI开发以及全面的人工智能咨询服务。我们的产品 AIW全智通,凭借其独特的认知引擎,不仅为中小企业提供了经济、定制化的AI解决方案,还确保了其输出的可管理性与准确性,完全满足企业的业务策略和道德规范。AIW开发底座版(AI PaaS),利用核心的封装式AI模块化技术,为企业提供了与现有业务系统兼容的AI增强解决方案。它的模块化和标准化设计,以及为企业现有系统增加AI功能的能力,都使得企业可以低成本、高效率地进行数字化升级。
我们的目标是帮助您解锁AI的潜力,提升业务效率和客户体验。欢迎与我们联系,共同探讨AI的未来可能性。