技术专家和Synesis One的首席执行官艾萨克·邦(Isaac Bang)警告称,少数科技巨头囤积数据并主导人工智能(AI)竞赛的“极其危险”情景。他主张“人工智能权力的民主化”,确保正在进行的AI竞赛的最终“赢家”不会成为行业巨头。
邦表示,解决方案的一部分在于优先考虑去中心化的数据众包,而不是依赖大型数据公司。正如邦在对Bitcoin.com News的书面回应中所解释的,去中心化的数据众包使公司能够避免使用内部数据科学家。相反,他们可以“向”一群数字工作者或专家提出数据分析任务。
邦认为,这种模式非常适合寻求扩展但缺乏内部资源的公司。除了商业优势,去中心化的数据众包还有助于应对集中式科技巨头面临的数据偏见挑战。
尽管政府对去中心化数据管理表示公共安全担忧,邦仍然警告不要出台可能最终扼杀创新的广泛监管。相反,他敦促监管者和立法者在制定政策之前研究“去中心化数据来源如何被利用”。
邦的其他回应涉及AI行业内的竞争以及与AI使用相关的固有风险。以下是Synesis One首席执行官对所提问题的回答。
艾萨克·邦(IB): 人工智能是引领第四次工业革命的关键技术,其影响远比我们目前能想象的要广泛。少数主导企业囤积数据并主导AI竞赛在许多方面都是极其危险的。人工智能技术不仅将使企业变得更高效并最大化其利润,还将使政府在物理和数字上增强其军事能力。AI竞赛的“赢家”将成为主导力量,我们必须立即采取行动,以便为所有人民主化人工智能的权力。
IB: 传统上,公司通过提供的产品或服务从用户/客户那里收集数据。为了利用收集的数据进行AI,公司雇佣数据科学家和其他专家来清理和标注数据。对于拥有众多用户和大量资金的大公司来说,传统的数据收集和准备方法是高效的。然而,对于中小型公司来说,扩展其数据需求将是困难的。
去中心化的数据众包是通过一个庞大的数字工作者网络来获取原始数据或进行数据预处理,这些工作者愿意并能够提供数据或预处理工作。公司或开发者可以在没有用户或内部数据科学家的情况下,从一群数字工作者或专家中发布数据任务的悬赏,以执行数据工作。这使得公司能够在不需要花费大量金钱和时间雇佣内部员工的情况下进行扩展。
IB: 人类具备进行逻辑推理的能力。如今使用机器学习的人工智能使用统计计算来识别模式,而没有任何逻辑推理。随着AI模型的改进,对高质量数据和特定领域数据的需求变得越来越重要。例如,通用的LLM不适合在医疗环境中使用。LLM可以针对特定的医学领域进行微调,但这样做需要在该领域具有专业知识的人类。这一概念不仅适用于通用LLM,还适用于任何其他具有更具体用例的AI应用。
IB: 这很简单——数据提供者和数据标注者的池越多样化,数据就会越多样化和具有代表性。在去中心化的众包网络中,原始数据和/或数据标注者的提供者并不来自一个平台、公司、网络或团体。这减少了集中式公司可能面临的数据偏见。
IB: 最实用的用例之一是在自然语言领域。如今的企业是全球性的,这要求公司能够在其服务的市场的所有语言中提供相同质量的服务和产品。然而,目前表现最好的大型语言模型(LLM)主要是基于英语的。我们已经看到公司依赖众包来处理不同的语言和方言,不仅仅是为了AI的需求,例如产品的本地化。
IB: 只要所有的数据交易都记录在链上,透明度应该足以解决任何监督和监管的担忧。如果监管者真的关心公共安全和安保,应该对集中实体的数据管理和使用制定更多的规定。立法者不应因恐惧而草率下结论,而应首先了解去中心化数据来源的利用方式。如果存在恶意意图或用途,他们应该介入,而不是发布伤害创新的笼统规定。
Synesis One首席执行官艾萨克·邦
IB: 目前,我们尚未见到平台的任何滥用情况。很难真正看到滥用可能对国家安全造成的潜在风险。在数据存储层面,Synesis可以与分布式存储解决方案(例如IPFS、Arweave)和集中式解决方案(例如AWS)合作,因此这取决于客户。在数据标注层面,每个人都经过同行评审,甚至同行评审可以由客户专门优化,以防止恶意行为。
IB: 在Synesis,我们的目标是成为全球最大的数字工作者网络,聚集专业和特定领域的专家,以满足公司在任何AI数据需求方面的帮助。随着AI在越来越多的用例中被利用,我们已经看到对AI训练(例如微调、RLHF、原始数据)专家级知识的需求增加。我们希望使任何规模的公司在任何领域都能够通过利用我们的平台和全球数字专家网络来扩展其AI数据需求。这不仅将帮助公司扩展,还将为全球的人们提供通过在线提供知识和技能赚钱的新机会。
IB: 令人惊讶的是,主流公司尚未解决其员工的许多痛点。其中一个是支付问题,因为跨境支付通常昂贵且缓慢。另一个主要痛点是缺乏透明度。这对我们来说是一个巨大的优势,因为我们的支付系统不需要最低余额,没有费用,并且是即时的。我们已经吸引了许多对使用大型Web2数据标注公司的数字工作者感到沮丧的人。随着我们吸引越来越多背景各异的数字工作者并建立网络,我们的解决方案将对潜在客户变得越来越有吸引力。
IB: 我们用户面临的最大风险之一是某些活动所需的知识和/或技能的不匹配。一些数据活动是技术性的,如果用户表现不佳,用户将不会获得良好的奖励。一切,包括用户的声誉,都基于用户提供的工作的准确性。一些任务需要技术技能/知识,或者有陡峭的学习曲线。因此,平台上的任何新用户都应该预期花一些时间学习如何完成某些活动/数据任务。我们不断更新和制作新的教育和培训材料,以帮助新用户和现有用户更好地执行任务。这对每个人都有好处,只要用户花时间阅读和学习这些材料。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。