邦盛科技王新宇:国产大数据实时智能技术的旗手 | 解码数字新浙商No.88

数字经济发布·2023年04月29日 08:52
数据智能时代,数据应如水流奔腾,在运用中实时处理计算,实时反馈。
邦盛科技
C轮北京市2010-05
大数据实时风险监控服务提供商
我要联系

数据最热时价值最大,邦盛通过自主可控的大数据实时智能处理技术,释放热数据价值。 

——邦盛科技 王新宇 

走进王新宇的办公室,墙上“国邦昌盛”四个大字映入眼帘,这是邦盛科技的由来,也是团队创业的初心。王新宇不仅是创业者,还是浙江大学计算机学院教授,入春时节,我们听他娓娓讲述邦盛的过去、现在与未来。

1978年,著名计算机科学家何志均教授组建浙大计算机系。发展到九十年代中后期,浙大的计算机学术研究达到了较高水平,但很多成果停留在理论阶段。退休返聘的何志均提出产学研结合理念,“要想发挥计算机的能力和威力,必须走到应用里面去”,时任系主任陈纯院士大力支持并推动产学研战略。 

2001年,美国道富集团与浙江大学共建技术中心,探索计算机先进技术研究和产业前瞻应用,刚刚保送博士的王新宇作为第一批学生加入其中。在杨小虎等教授的带领下,团队掌握了金融领域的知识和产业经验。 

2010年,邦盛科技成立,埋头自研时序大数据实时智能处理平台“流立方”。王新宇回忆道,“陈纯院士说,流立方研发不成功,邦盛就不办了,为了不分散团队精力,我甚至把到手的项目都谈崩了”。 

蛰伏五年,“熬”走了三波股东,“流立方”终于研发成功,核心性能指标超国外同类产品近百倍,每秒可以达到300万笔的吞吐量,并且可以做到毫秒级时延。至今,该项技术已应用于金融风控、政务安全、智慧交通、信息通信、网络安全等领域,实现了国产替代。在数据量爆炸式增长的时代,大数据实时智能技术正在成为必需品。 

在王新宇对数据智能时代图景的描绘中,数据应如水流奔腾,在运用中实时处理计算,实时反馈。 

“我把这样的时代称为:万物皆流 ”。 

谈产学研结合

邦盛的成长跟浙大的人才支持是分不开的

章丰:你和邦盛都基于浙大的产学研体系,作为教授兼企业家,你如何看待产学研结合的模式?

王新宇:浙大计算机学科的产学研结合理念一脉相承,起源于创系人何志均先生,陈纯院士是他的第一个博士生。当年,七十多岁的何志均先生退休返聘,他主张研究成果应该落地,让产业用起来,觉得“要想发挥计算机的能力和威力,必须走到应用里面去”。陈院士很认同这个观点,他作为系主任很坚决地执行了这个战略,把产学研结合的理念发扬广大。

2001年,何志均先生牵头推动了计算机系和美国道富银行的合作项目,并和陈院士安排了杨小虎、孙建伶、周波、李善平等几个年轻教授带队,起步时只有15个学生。当时我上大三,作为直博的学生也加入了。

道富有一套80年代由MIT(麻省理工学院)背景团队开发的股票交易系统,每天都宕机,严重阻碍了业务发展,客户流失率高达百分之八九十。系统改造特别难,代码文档都没了,只有一百多万行源代码。道富先后咨询了印度和美国的IT公司,要价两千万美金,还不一定能改造成功。机缘巧合,他们接触到了浙大计算机系。

几个教授带着我们硬读代码,我被分到了中央交易系统部分,40多万行源代码,天天通宵读。我们花了一年多时间把系统“救活了”,流失的交易又回来了,业务量增长了6倍,当年创造了5000万美金的净利润。

一炮打响后,道富陆续把一百多个核心系统交给我们研发与重构,包括外汇交易系统、合规风险监控系统。我做了三四个非常难啃的项目,包括全世界第三大的外汇交易系统。

章丰:所以你们当时直接接触到了产业里真实的问题。

王新宇:陈院士和杨教授推动浙大网新和道富在技术中心的基础上成立了网新恒天,陆续留下了三四百个浙大计算机系的学生,项目也逐渐拓展到为华尔街等其他金融机构服务。这个团队能见识到全世界最先进的技术趋势,还能动手操作,做完的产品还能在伦敦和纽约投产。技术中心最巅峰的时候,专业前十名的学生都想来,至今毕业了近1000位硕士博士。后来道富收购了整个团队,成立了道富银行杭州研发中心。

章丰:从科研到应用再到人才培养,形成了良性循环。

王新宇:与道富银行的合作是构建产学研闭环的过程,产业里不断遇到新问题,新问题促进学术研究螺旋上升。这种非常独特的产学研互动现象,也得益于浙大开放和开明的思想。

之后互联网发展,但核心组件以IOE(IBM、Oracle、EMC的简称,三者均为海外IT巨头)为主,国内厂商都是做应用的,中国缺乏核心技术,所以陈院士意识到我们必须走自主创新的路了。当时很羡慕Oracle,他们做出优秀的中间件,全世界都用它的数据库,浙大这样的高校也有同样的人才基础,我们能不能做个类似的公司,研究中国自主可控的核心技术和软件?

所以2010年陈院士辞去浙大网新董事长,带着我和王新根(邦盛科技CTO)出来创业,他说“名字都想好了,就叫邦盛,咱们目标是国邦昌盛,这是初心”。

后来浙大系创业者又陆续成立了趣链、谐云,都是陈院士支持团队和学生创办的企业,团队已经在国际软件开发产业积累了大量经验,成长都非常迅速。

章丰:这几家公司的成长路径,是否可以理解为产学研2.0版?

王新宇:是,2.0和1.0有明显的不同,1.0是大型企业与学校项目制合作,2.0是靠市场化融资去大规模成体系的研发硬核科技并进行应用推广。我们发展后也建立了浙江大学研发中心,进一步支持学校培养人才,邦盛的成长跟浙大的人才支持是分不开的。

谈数字价值释放

数据最热时价值最大,热数据价值挖掘是数字化转型的抓手

生活中数 据无处不在,普通的举动背后可能隐藏着海量计算——当你刷卡消费时,银行系统会基于上千条计算规则,结合你过往的消费记录、消费水平等指标,分析是否存在伪卡、盗卡或欺诈风险,防护你的交易; 当你抢购春运火车票时,无需像以前一样面对复杂的图形验证码着急,系统会基于计算模型分辨出真人和机器人,将网络爬虫和黄牛隔绝在外,优化你的体验……这些计算和判断都在毫秒内完成,对大数据实时智能技术要求极高。 

章丰: 提 起邦盛的技术, 绕不开 “热数据” 这个概念 ,如何理解? 

王新宇:热数据是指新鲜的数据,数据最热时价值最大。原先的做法是把刚产生的数据存储下来、清洗、建模、给出信号,事后查询、校验,数据价值随着时间指数级衰减。 

热数据价值挖掘,或者说热数据价值最大化,就是在数据产生后实时处理,更快指导业务决策。数据处理既要快、又要准,这就需要大数据实时智能处理技术。 

章丰:就像一盘菜冷了,口味就指数级下降,数据如果冷了,本身的价值也降低了。 

王新宇:有的人认为很多场景不需要毫秒级、秒级的数据价值,包括金融领域,风险识别也分为事前、事中、事后,可能分钟级、小时级的处理就够了。但数据大爆炸会带来新问题,比如针对金融的事后监管,一家股份制银行要处理三年的数据,用国外的大数据平台跑两个多星期才能出结果,用邦盛的平台两个小时就能出结果。 

章丰:金融交易对时间高度敏感,数据处理越快越好。流立方技术的应用,有什么直观的案例? 

王新宇:比如邦盛的第一个客户银联商务,它提出的需求是事中风险防控,解决反欺诈的实时计算问题。典型场景是用户的卡被人盗刷,系统如何在他交易的过程中就判定欺诈? 

举一个判断逻辑,盗卡人不知道卡的额度,会在POS机上刷2万、1.5万、1万,企图把钱套出来,如果和卡上过去1年的交易行为对比就会发现异常。风控系统里有近千条这样的模型规则,银联每年有1300多亿刷卡流水,分析时要回溯大量的数据,快速完成判断。流立方技术可以做到每一笔刷卡在10毫秒内计算,智能识别风险并做出决策。 

当时邦盛和全球排名前几的金融软件巨头同台竞标,我们的方案是用四台PC叠加流立方技术,就能解决银联全国刷卡的实时风控问题,最后在项目里脱颖而出。 

章丰:热数据的价值发掘抓住了业务数字化驱动的“牛鼻子”,也很契合最近提出的“数据要素价值化”。你怎么看待这个议题? 

王新宇:数据只有流动、分享、加工处理才能创造价值。数据要素价值化,首先要解决行业内数据烟囱的问题。至今数据还没打通,行业里也不断提出隐私计算、联邦学习等技术路径,但收效甚微。 打通整个数据产业,不光靠技术,还需要政策制度等国家自上而下的推力。

数据打通后一定要变革生产关系,发挥热数据的价值,热数据价值挖掘是数字化转型的抓手。统计显示,以前500亿大数据市场中可能98%都是历史大数据,将来实时大数据占比可能会超过50%,热数据的应用需求增多。现在各行各业都在找邦盛解决问题,除了流立方技术,邦盛也研发了动态时序图实时计算平台“图立方”、三核决策引擎技术等,满足市场对热数据处理的需求。 

高并发、海量、长周期、大纬度的数据处理,过去只是高阶需求,但在数据量爆炸式增长的现在,大数据实时智能技术正在成为必需品。

谈路线选择

面向企业级市场,扩大国产核心技术的辐射面

早在做道富项目时,王新宇就注意到金融合规系统对时效性要求,“交易时机转瞬即逝,需要毫秒级的判断”。创业初期,面对金融领域的两大发力点——银行系统分布式部署和OLAP(联机分析处理)等数据分析技术,邦盛果断选择了后者,“OLAP存在连续的市场机会,作为一家新型公司可以切入。”

章丰: 现在经常提 “掌握关键核心技术”,“关键核心技术 ”到底是哪些 ? 

王新宇:从芯片、操作系统、数据库、大数据平台、人工智能平台,甚至人工智能大模型,全栈都是关键核心技术。中国在这些技术上,有的被卡得寸步难行,有的用开源技术替代,但是基于开源技术开发的路线只能跟着人家走,永远无法超过开源技术的发起者。

中国99%的公司都是基于开源技术做增强,我们分析后发现,基于开源技术开发产品的天花板较低,尤其是应对中国巨大人口基数的市场环境,需要超大的硬件集群来解决应用性能问题。为什么互联网大厂没遇到?因为他们用的是超大型集群,一个应用背后是上千台机器,但中国绝大多数的机构单位没办法负担这样的成本。

互联网大厂本身提供云平台服务,比如一共6万台服务器,其中2000台自己用,那是生态的打法,不是企业级方案,非互联网企业不可能用几百台机器解决一个应用,运维成本极高。而邦盛只需要四台机器就能帮助他们解决性能问题,对于企业客户来说,从不可行变成可行了。

章丰:邦盛的技术和产品与大数据底层的开源技术之间是什么关系?

王新宇:开源技术把生态串联起来,邦盛的核心技术在生态中做增强。对于业内普通的数据处理问题,客户可能基于开源技术增强就能解决;复杂的、高性能的计算以及快速的回溯历史数据分析,用开源技术解决不了,就可以把邦盛的产品作为增量式的平台引入。如果客户没有使用开源技术,我们的产品也可以独立运行。

研发核心技术和软件,最终是要面向企业级市场,扩大国产核心技术的辐射面,才是我们的初衷。

章丰:目前邦盛的400多家客户是中大型企业,流立方这样的大数据实时智能处理与决策技术,如何真正惠及小而散的业务场景?

王新宇:技术普惠的方向一定是和行业云结合,变成一种可调用的服务。比如目前一些行业形成了行业云,邦盛与行业云的平台方合作,作为实时智能技术的提供方接入其中,云上的中小企业都可以享受我们的服务,以SaaS模式按照流量笔数收费。

美国已经有很多大数据提供商在亚马逊、snowflake等生态里提供实时计算、处理、决策的能力,企业调用一笔服务可能只要花几毛钱。

章丰:中小企业不可能做私有化部署,一共就拉五吨车,里面塞核动力的发动机,昂贵且没必要。

王新宇:但国内的产业土壤不一样,现在各行各业更多是使用公有云,比如说华为、阿里。国内特别普遍的现象是各行各业都分工不清晰,“我觉得你做的挺有前景,虽然我做不到你这样,但我模仿个六七成,自己干一套”。

政策也在引导各领域行业云的形成,但需要一个过程,这不是靠一家技术企业就能实现的,而是整个行业逐渐形成健康的生态,包括对知识产权的尊重、清晰的产业分工等。

谈AI冲击

强人工智能让“万物皆流”时代更快到来

章丰: 这段时间人人都在讲大模型,作为数据智能应用领域的专家,你怎么看待所谓的“AI的iphone时刻”? 

王新宇:我认同这个观点,GPT的出现代表了强人工智能时代的到来。GPT在技术上并不是颠覆性的,原理还是逐步猜测下个字的过程,但是参数量达到一定程度后,它能将知识触类旁通,覆盖复杂网络里的大多数点,能力显著增强,表现出了强人工智能的特性。

未来,把整个历史上的知识全部灌到GPT大模型里,通过知识关联、整理、归纳、汇总,它就形成了一个博士水平的智能体,接受特定领域的打磨后,就能很好地提供相应服务。

章丰:有人担心快速发展的AI会带来威胁,前不久未来生命研究所发布了暂停巨型人工智能实验的公开信。

王新宇:我认为AI存在威胁,它的知识迭代太快了,人需要从小到大学习二十几年才能达到正常水平的认知,AI几分钟、几小时、几个月就变成了新一代的智能体。危言耸听地说,AI持续发展下去,人类会有被毁灭的可能,就像马斯克认为人类只是人工智能的bootloader(引导加载程序),人类的成千上万年的历史可能是为了产生人工智能而出现的短暂现象。

AI表现出来的强力会吸引全世界蜂拥而至,所以人类能否制止AI的发展,还要打个问号。

章丰:AI的发展是像空气一样弥散开来的,甚至可能连法律都很难禁止。

王新宇:各行各业都在思考强人工智能会带来什么。大模型本质属于知识生成领域,任何应用中知识的产生都是关键一步。目前大模型还不具备高精准性、强解释性和强控制性,只能提供思路框架或者大致方法。但AI的演化会更强,最终不需要外力就能完成工作。

我们也在跟进规划,比如如何让AI知识生成之后自动加载到流立方,实现流立方内部逻辑的自动进化。我把这样的时代称为“万物皆流”,用户产生数据,剩下的数据处理、计算都喂给我们平台,整个过程都是流动的热数据,数据进入平台后自动沉淀知识,实时反馈。

万物皆流是我的理想,邦盛正在朝这个方向走。

快问快答

达成目标后,你如何犒劳自己?

制定下 一个目标。 

挑选合作伙伴,你最看重的品质?

工作能 力,学习能力,人品。 

给创业者的一个锦囊?

“一根针顶破天”,做细分领域的隐形冠军,或在一个细分领域保持长期主义。 

你最想改变世界的一件事?

实现万 物皆流。 

如何定义“数字新浙商”?

创新性强,数智化思维。 

作者 | 蒋雷婕 

编辑 | 王小猛 

发现未来独角兽,项目BP发过来!

如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@www.element-up.com,我们会及时回复。 

36氪浙江——让浙江创业者先看到未来!

本文来自微信公众号“数字经济发布”(ID:DigitalEconomy),作者:数字经济学会,36氪经授权发布。

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

报道的项目

邦盛科技
我要联系
大数据实时风险监控服务提供商

下一篇

乡贤回归,新兴赛道加速“推背”中。

2023-04-28

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

Baidu
map