专访DIN创办人Harold:Web3数据网路如何打破「AI数据血汗工厂」魔咒? – PANews

专访DIN创办人Harold:Web3数据网路如何打破「AI数据血汗工厂」魔咒? Zen |2024-12-10 16:00 在即将推出的L2资料链和代币经济体系的加持下,DIN不仅为加密货币产业注入了新的活力,也将为AI和传统资料产业提供更多的可能性。

作者:Zen,PANews

随着AI技术的快速发展,数据成为驱动其成长的核心动力,其重要性不亚於石油对於现代工业的角色。高品质资料的取得、标注和处理是AI模型训练的基石,而这个过程的大量依赖人工处理、效率低下、成本居高不下和品质参差不齐等问题,使得现有产业链中依然面临巨大挑战。

如币安创始人赵长鹏(CZ)所言,AI数据标注等任务非常适合透过区块链完成,可藉助全球低成本劳动力,并透过加密货币即时支付,打破地域限制。 CZ也提到,目前仍需更多工具建设,并呼吁开发者共同建构去中心化的AI资料处理生态。

事实上,自从人工智慧热潮兴起以来,开始专注做去中心化的AI数据业务的项目也不在少数,但鲜有项目能实现商业模式落地,而在BNB生态上表现突出的DIN则是其中一例。 DIN目前拥有超过3千万注册用户和百万日活用户,数次居於BNB Chain上AI Dapp排行榜榜首。更重要的是,DIN不仅带动了去中心化的AI资料经济,同时也开始真正赋能Web2 传统产业发展。

DIN:AI时代资料流水线员工的上岗证

DIN是首个模组化AI 原生资料预处理层,旨在建立基於人、资料和AI 协同作用的资料智慧网络,让每个人都能为AI 处理资料并获得报酬。截至目前,DIN总融资已达800万美元,其先於去年7月完成Binance Labs领投的400万美元种子轮融资,又在今年8月完成400万美元Pre-listing(预上市)融资,Manta 、Moonbeam、Ankr、Maxx Capital等人参投。

在采访中,DIN创始人Harold表示,如果用最通俗易懂的方式来对DIN进行介绍,其可以称为“AI时代数据流水线员工的上岗证”, 让全球每个普通人都可以随时随地无门槛参与,享受crypto带来的无边界灵活支付,并瓜分AI发展带来的源源不绝的时代现金流红利。 「AI 需要海量的数据促进自身的发展,那麽每一个人都应该能够因为它产生的数据而受益,DIN希望能够在中间充当一个桥梁,让每一个人生产的数据能够被记录,每个人能获利。

DIN的名称源自於Data Intelligence Network的缩写。在过去三年中,DIN专注於围绕「数据」提供产品和服务,涵盖链上数据、社群媒体内容等链下数据,其前身为Web3数据智慧公司Web3Go。在创立这个计画之前,Harold一直从事於人工智慧产业,其领导的团队研发的钢铁表面缺陷检测等AI应用也得到了落地。由於团队拥有大数据、人工智慧和通讯领域的多年累积和经验,并在数据赛道深耕多年,DIN已经形成了一套成熟的服务交付体系,且每年均能实现盈利。

区块链实现数据众包革命

众所周知,演算法、算力和数据是人工智慧的三大核心要素,其中数据是人工智慧发展的基础,倘若缺乏足够的数据支持,任何先进的演算法和算力都将无从谈起。因此,AI模型的「数据工厂」在人工智慧浪潮中愈发举足轻重,该领域的龙头Scale AI於今年5月更是以138 亿美元估值完成了最新一轮高达10亿美元的融资,由矽谷顶级基金Accel领投,YC、英伟达、亚马逊、Meta、AMD等一众科技巨头参投。

Scale AI的客户群包括医疗、国防、电商、政府服务等多个领域,其透过向客户提供高品质数据,同时将大部分品质保证责任和成本转嫁给个人任务执行者,从而实现盈利。 Scale AI众包平台Remotasks在肯亚、菲律宾、委内瑞拉等地区设立了数十家机构,拥有数千名资料标注员。

然而,这种利润主要集中在中心化公司手中的方式无法更好地激励参与者,也无法充分解放劳动力。根据The Washington Post报道,Scale AI 支付工人的工资极低,经常拖欠或扣留工资,几乎没有为工人提供追索管道。人权组织和劳工研究人员表示,Scale AI 是众多未遵守海外工人基本劳工标准的美国人工智慧公司之一。可见,在中心化和垄断化企业主导的人工智慧热潮背後,有一支「数位血汗工厂」中的海外劳工大军,他们支持着AI产业的蓬勃发展,但在劳动密集型工作中却时常遭到剥削,未得到应有的回报。

「生产、蒐集资料的模式完全是中心化的,我们认为这不利於AI 技术的长期发展,因为每个人都是资料的生产者,但却并没有从中获得收益。」对於资料垄断和高度中心化的问题,

Harold表示,基於区块链的去中心化和公开透明的特性,透过将AI 数据与之结合,可利用区块链去管理数据,记录每一个人对数据的生产过程,最终使用区块链去进行结算,使提供数据的使用者持续获得收益。

拳头产品xData与Chipper Node连通B、C端

「DIN提供了一套涵盖数据采集、标注、验证及向量化的全端解决方案,」 Harold介绍。其核心产品xData 专注於推特内容资料的收集与标注,能够围绕特定项目或主题定向采集内容,将分散的素材汇总为完整的资料库。透过xData,一方面使用者可以低成本、低门槛地参与AI 资料的收集与标注并获得收益;另一方面,客户也能藉此获得更多的曝光机会,同时满足资料收集与处理需求。截至目前,xData 已成功收集并标注超过1亿条推文。

AI模型经过多次迭代,其训练过程不仅需要大量数据,还必须确保数据的高品质。 「高品质资料是提升模型准确性和可靠性的关键,而低品质资料可能导致偏差甚至错误的结果。」Harold表示,AI模型在训练和微调时,需要大量经过清理、验证并合格的数据。

在DIN 生态系统中,Chipper Node承担资料「质检」和优化的重要角色。 Harold指出,Chipper Node利用使用者边缘设备的闲置算力,对xData 收集的原始资料进行验证、分类、清理和向量化处理。此外,Chipper Node不仅实现了网路内奖励的转换,也推动了经济体系的高效运转,让用户能够随时随地透过挖矿获得收益,最终实现AI数据贡献者的支付闭环。

透过Chipper Node和xData的协同作用,作为桥梁的DIN打通了B 端企业与C 端用户之间的连接通路。企业端能够透过DIN生态以更有效率、更低成本的方式获取经过验证的优质数据,而用户端则能够以低门槛的方式透过日常的参与贡献数据内容并获得奖励。这种模式不仅实现了数据供需两端的高效匹配,也显着提升了用户的参与感和收益体验,为DIN生态的快速发展注入了强大动力。 Harold称,目前DIN总用户数已突破3000万,每日活跃用户达70万,DIN每日处理链上交易达100万,展示了高度活跃且可扩展的区块链生态系统。

值得一提的是,DIN的资料储存在去中心化储存基础设施BNB Greenfield上,後者透过将资料分片并储存在多个节点,显着降低储存成本,同时提高储存效率。此外,由於优化的分散式储存架构,Greenfield 能提供接近传统Web2 云端储存的存取速度,同时确保去中心化的安全性和可靠性。这使得DIN确保了在为用户提供激励的同时,兼顾资料在网路中传递的安全性和隐私保护。

赋能Web2 传统产业,DIN已真正实现产品落地

与大多数AI+Web3专案停留在畅想大规模采用的阶段不同,DIN提供的AI数据已开始赋能Web2 传统产业发展。 Harold透露,早在几个月前,DIN已和思必驰(AISpeech)旗下的数据标注公司核数聚进行合作,透过BNB Chain 为思必驰小语种进行语音数据的标注和蒐集。

思必驰作为国内语音技术领域的独角兽,与科大讯飞齐名,专注於语音识别、语音合成和自然语言处理等核心技术,其技术广泛应用於汽车导航、车载语音助理等产品中,为驾驶提供高效率、便利的智慧互动体验。在全球化的市场背景下,车载系统必须能够支援多语言交互,尤其是在跨国销售和多文化融合的环境中。这需要大量高品质的小语种及方言的语音数据,用於训练语音辨识和合成模型。传统的数据标注方式往往成本高、周期漫长,难以满足快速迭代的需求。

然而,透过利用DIN 的区块链网络,将小语种语音数据的标注和蒐集任务分发到全球的分散式劳动力网络中,将显着提高效率和数据覆盖范围。一方面,DIN 的平台透过多层验证和审核机制,确保标注资料的高品质和一致性,且多语种的覆盖范围使得思必驰能够快速建构和优化其小语种语音模型;而另一方面,所有资料的处理流程都记录在链上,确保透明、可信,方便未来的审计和溯源,这在日益严格的隐私保护和资料合规要求下对语音技术企业至关重要。

DIN 的技术和商业模式不仅证明了去中心化资料网路的可行性,也为传统产业注入了新的成长动能,成为Web2 与Web3 融合的重要驱动力。展望未来,DIN 预计将其数据智慧网路的能力扩展至医疗、教育、零售等产业,透过应用AI 数据处理,协助传统企业实现智慧转型。

在熊市坚守,反哺推动BNB Chain 生态发展

在刚过去的熊市环境下,市场流动性差、用户活跃度低、缺乏用户验证产品等问题突出,不断内卷致使获取用户的成本也显着提高。这些挑战无疑对专案的营运和发展带来了巨大压力。 Harold坦言,在许多专案透过短期机会「赚快钱」时也让他们有些眼红,但最终DIN还是选择专注於长期价值创造,而非追逐短期利益、急於变现或迎合市场短期波动。

「我们算是一个比较务实和踏实的团队。」Harold补充说,DIN一直以来都更想坚持做正确的事情,这一过程中偶尔会进展缓慢,有时会痛苦难熬,但这正是在前沿科技领域创业的常态,只有咬牙坚持,才能走得更远。

从推动链上数据分析到实现用户友好的AI代理平台,再到开创去中心化的AI数据预处理工具,除了AI数据基础设施的定位外,DIN团队近几年还始终坚持在BNB生态深耕,并在获得其资金、资源等支持後又助推了该生态的发展。例如,DIN推出的Chipper节点预挖矿和xDIN交易不仅带来了显着的交易量和链上活跃度,同时也带来了超过4万个运行中的节点和超过5万个高品质的节点持有者。这进一步活化了BNB Chain的链上资料生态系统,并提升了使用者的参与度。

此外,近期,DIN透过节点预挖矿、币安Web3钱包空投活动和币安广场徵文大赛,仅一周就为BNB Chain 带来了近750万笔交易,40万次曝光。不仅如此,DIN还帮助币安在短短10天内吸引了超过26万名新用户注册。

即将到来的TGE与基於BNB链的L2区块链

恰逢牛市,DIN即将迎来专案发展的关键节点。 Harold称,DIN 将在BNB 链上建构一条专属L2 资料链,以进一步推动去中心化AI 资料网路构想的落地。不久後推出的DIN代币则将作为这条L2 链的核心燃料,用於支付数据存储、节点运营和AI 代理创建与交易等链上操作的gas费,成为这一去中心化网络的硬通货。

此外,DIN代币采用通货紧缩模型,每次代币消耗都会燃烧DIN,持续减少市场供应,带来稀缺价值。同时,DIN 团队计划定期将Web2业务产生的利润用於回购代币,以进一步强化其价值支撑。 Harold透露,DIN在两年前就已获利,其成熟的Web2 数据业务为Web3 发展提供了稳定且可持续的支援。

在本轮牛市,随着BNB 的流动性显着提升,价格飙升至历史新高,市场对其生态发展的信心空前高涨。不少从业者分析认为,BNB Chain 很可能会在短期内宣布重大动作。而DIN L2 数据链的推出恰逢其时,结合近几个月的表现,其或将充分受益於BNB Chain 的生态红利,与其共同推动Web3 数据经济的发展。

总的来看,凭藉其在BNB生态的强势表现和成熟的商业模式,DIN正在将去中心化AI数据经济的愿景逐步落地。在即将推出的L2资料链和代币经济体系的加持下,DIN不仅为加密货币产业注入了新的活力,也将为AI和传统资料产业提供更多的可能性。

深度数据PA原创AI区块链BNB Chain基础设施去中心化

Leave a Reply

Your email address will not be published. Required fields are marked *