时至今日,所有科技领域的参与者和关注者都不可能忽视隐私计算的绚丽绽放。
近日全球权威IT研究与顾问咨询公司Gartner发布2022年12大前沿战略科技趋势,隐私增强计算(PEC)继2021年后再度入选。Gartner评论道,隐私增强计算利用一系列隐私保护技术在确保合规要求的前提下获取数据价值。
在国内,隐私计算迅速经历了从科研到应用,从认知到实践的过程。不过对于大多数行业和企业来说,用隐私计算来解决敏感的数据安全共享和隐私保护问题,依然有许多疑惑。社会在问隐私计算到底如何释放数据价值,行业和企业要问应该用哪种隐私计算技术,即便是众多隐私计算技术服务商,他们对于技术和商业模式的探索也都一直在路上。
事实上,Gartner的评论已经给出了清晰的思考方向——数据价值。国内隐私计算领军企业翼方健数CEO罗震在11 月 10 日举行的Data X大会暨翼方健数战略发布会上就指出,隐私计算未来的发展应该从解锁数据价值的高度重新审视。隐私计算是解锁数据价值的重要技术核心,但在数据价值流动中是必要条件而不是充分条件。
罗震认为,各行各业对于隐私计算的热情、疑惑、诉求,本质上都源于对数据价值的渴求。从获取数据价值的初心出发,隐私计算是重要技术,但不是唯一技术,还需要和大数据、人工智能、区块链等技术结合。因此,翼方健数虽被称为国内隐私计算“四小龙”之一,却把“用技术解锁数据价值”作为公司的愿景和使命,这里的“技术”指的就是包括隐私计算在内的各类技术协同。
一个颇具共性的问题和共识是,尽管隐私计算话题很热,但真正落地却难度不小,既要理解和相信技术,又会有合规等各种顾虑,让人不敢第一个吃螃蟹。许多隐私计算技术服务商在拓展客户时听到最多的一句话就是:“我们想先看看有谁已经用了隐私计算再做决定。”
事实上,经过近两年的耕耘,隐私计算在各种场景中都已经积累起了不少典型案例。罗震在Data X大会上分享了翼方健数近年来的十大案例。
这些案例都很好地诠释了“用技术解锁数据价值”的理念,显示了丰富的多样性以及翼方健数在隐私计算热潮中的“实践派”风格。
数据和算法资源匹配
格物致和、燧坤智能:数据赋能AI制药的案例是典型的数据持有者和模型持有者的完美匹配。格物致和(Biosciences)拥有具有自主知识产权的“药物-细胞-基因”数据库DGDB(Drug Gene Data Base),燧坤智能是致力于运用人工智能和机器学习方法系统性赋能创新生物医药研发的新一代平台型技术公司。这两家公司分别代表了数据提供方和数据需求方,对应着数据价值变现和模型IP保护的诉求。基于隐私安全计算平台,双方可以将自己的数据库和模型部署在翼方健数运营维护的生物数据平台上,数据和模型的需求方在平台内授权协作。
政企多方协作
宜昌传染病多点触发监测和智慧化预警平台是较为复杂的政企多方协作案例,目标在于利用不同数据源筛选出传染疾病的高风险人群,数据越多就越容易实现精准筛选、消除误报。为此,翼方健数打通了多个内部和外部数据源并跨平台联和计算,包括从城市医疗数据隐私安全计算平台获得历史药品销售、高风险症候群数据,基于城市政务数据隐私安全计算平台的民政、教育、人社数据发现症候群热点发现预警,还结合了第三方搜索公司的关键词搜索量数据等。基于这些数据的联邦学习时空预测模型可以提前几天预知高风险人群的数量,还帮助医生提高传染病诊断的准确率。
内外兼修
“瑞金医院:未来智慧医院的数据价值释放”是典型的打通组织内部数据的案例。翼方健数与瑞金医院合作打造了医院隐私安全平台,让医院数据同时服务于临床应用和医学研究。其中在内分泌科,住院病历辅助书写因此从过去耗时20分钟缩短至5分钟,有47%的医生在日常工作中使用这一工具。此外,相关数据还帮助肿瘤科制定质子肿瘤大数据治理标准化流程并完成多篇论文发表。
罗震表示,在这些落地案例中,隐私计算带来的效果不仅可见,还可量化,充分证明了隐私计算的能力和价值。
隐私计算或许十分前沿,但数据保护相关技术早已有之,数据共享也一直在发生。那么隐私计算是热度还是必须,传统的数据保护技术是否价值犹存,就成为值得探究的问题。
罗震坦言,如果只做单一应用,确实可以不需要隐私计算技术,但从上述多个案例可以看到的趋势是,越来越多不同的场景其实都使用了同样的数据源,如医疗保险反欺诈、分级诊疗、病历书写、症候群预测等。
过去,数据往往被重复使用和处理,现在基于隐私计算的数据底座就能实现统一的数据开放,再基于这样的数据底座开发各种应用。在此体系中,隐私计算平台就为数据要素化提供了底座和基础设施,能够让不同城市、不同部门既能自己管好自己的数据,又能打通数据、共同协作。隐私计算平台让数据要素在技术层面变得可用可扩展,赋能多种应用场景,也是更全面地解锁了数据价值。
当然,数据的汇集是有限度的。罗震认为,当区域内的数据协作达到一定程度后,跨区域协作的网络就会形成,不同城市或区域成为节点。隐私计算平台的演化也会经历单体、联盟、生态网络三大阶段,分别包括单体平台(局域网)、平台联盟(专业网络)及数据和计算互联网IoDC (Internet of Data & Computing)。
翼方健数用来承载起IoDC的,是隐私安全计算平台XDP翼数坊及其为数据价值解锁所定制的自研技术。翼方健数首席科学家张霖涛介绍,XDP翼数坊包括了从底层技术到上层应用的多层架构,如分布式文件系统XFS、计算资源调度与适配引擎XEE、数据发现与整合引擎XDaaS、以及它们支持下的沙箱XSandbox、可信执行环境XTee、联邦学习框架XFL、以及密文计算框架XSC等计算引擎。
XDP翼数坊平台中还包括了丰富的工具选项,有为单体平台提供“零信任”本地计算环境的安全沙箱,提供基于硬件的安全、高效、通用的端到端可信执行环境XTEE,人工智能数据标注工具GoldFinger,数据治理工具DataWand等。
另外,XLedger还将隐私计算与区块链技术融合,提供数据确权与价值分配机制,为数据交易奠定了基础。在Data X大会上,翼方健数还首次发布了自主研发的联邦学习框架XFL和密文计算框架XSC。
如果说IoDC是宏大的天文周期系统,那么XDP就是一台精密的计时机械,时间贯穿其中,万物运行。尽管对于用户来说不必完全理解微观技术和宏观体系,但罗震还是对有意尝试隐私计算的企业提出了建议。
他再次强调,用户在选择隐私计算技术服务商时,仍要紧抓数据价值的主线。隐私计算是技术手段,不是最终目标。隐私计算促进数据流通,而数据流通的目的在于创造更多的数据价值,这也是翼方健数用技术解锁数据价值的着力点。
第一是数据全周期视野,翼方健数建立了从数据清洗、数据管理、数据标注、数据价值抽取、数据价值分配、数据交易等一系列工具和应用,让数据真正能够被用、好用。
第二是全栈技术解决方案。没有一种技术可以解决所有问题,应该根据不同的安全信任假设和计算复杂度,采用合适的计算方式。翼方健数围绕XDP翼数坊平台的隐私安全计算能力,从单体到联邦到IoDC,从沙箱到可信执行环境到多方安全计算和联邦学习,在隐私计算赛道建立了最有竞争力的全栈技术解决方案。
伴随立法完善、合规趋严、技术融合等要求和机遇,隐私计算已经开启了全面落地,也催生了各类隐私计算技术服务商。毕马威《2021隐私计算行业研究报告:深潜数据蓝海》指出,隐私计算国内市场规模将快速发展,三年后技术服务营收有望触达100-200亿人民币的空间,甚至将撬动千亿级的数据平台运营收入空间。
市场体量的增长驱动了隐私计算头部创业企业进入高速发展期。罗震透露,翼方健数2020年的各项业绩相比2019年均实现强势增长,包括营收增长7倍,客户数量增长3倍,员工人数也实现翻番。随着IoDC在全球各地部署,数据和计算互联网的雏形已经初步形成。
谈及增长背后原因,罗震认为是源于翼方健数对隐私计算的深刻认知。“我们不满足于提供技术手段给到我们的客户,我们需要帮助客户实现可衡量的数据价值本身”,罗震说道。