kaiyun官方网站提议了一种基于数据的系统描绘新样式-开云·(Kaiyun) 官方网站 登录入口

当大数据席卷百行万企,结果表面也迎来新的拐点:从依赖模子到依赖数据。
可是,在数据驱动结果规模,却贫乏一种轮番化的数据流露样式。
针对这一问题,清华大学李升波教讲课题组(iDLab)初度将当代结果表面中的轮番型见地引入数据驱动结果(datatic control)范式,提议了一种基于数据的系统描绘新样式。
每个轮番样式的样本由必要的鬈曲和可插拔的属性构成,分散用于描绘系统变化规章和东说念主为界说特征。

不仅如斯,该数据轮番型还可字据算法需求定制属性,权贵加快结果器贪图,为提高数据驱动算法着力提供了新的念念路。
现在,该后果已发表于 ACC2025。
从模子轮番型到数据轮番型
东说念主工智能的茂密发展,离不开数据这一中枢维持。
连年来,跟着东说念主工智能本事的平庸应用,以数据为中枢的系统表征方法马上渗入到结果规模。
结果系统的贪图方法正迎来一场从模子驱动向数据驱动的范式变革,即从传统的模子驱动结果(modelic control,即 model-driven control)到数据驱动结果(datatic control,即 driven control)。

图 1:两种结果范式对比
模子驱动结果(上方旅途)最初诓骗系统辨识来拟合一个模子,然后用这个模子来合成结果器。
数据驱动结果(下方旅途)则径直诓骗数据来求目田手器。
在模子驱动结果(modelic control)的范式下,模子的轮番型是一个有劲器具。
举例,当代结果表面的奠基东说念主鲁说念夫 · 卡尔曼(Rudolf E. K á lm á n)指出:将景色空间模子流露为可控轮番型或可不雅轮番型,无需非凡的判断门径即可径直确保系统的可控性或可不雅性。
此外,当代群论的奠基东说念主之一卡米耶 · 若尔当(Camille Jordan)指出:任何景色空间模子皆不错调度为约旦轮番型,系统矩阵会变为对角方阵,其对角线元素代表系统的特征值。
因此,只需检查悉数特征值是否为负,即可浅显考证系统的贯通性。更进一步,不同的特征值对应着系统不同的模态,这使得结果器贪图更具针对性。
数据驱动结果(datatic control)范式下的轮番型是一个新问题。
连年来,跟着机器东说念主、自动驾驶等具身智能系统的茂密发展,海量、复杂的交互数据正曩昔所未有的速率被生成。这不仅为传统结果算法带来了弘大挑战,也引出了一个全新的议题:
在数据驱动结果范式下,怎么构建一个有用诓骗大限制数据的轮番描绘方式?就是否存在数据驱动版块的轮番型?
数据的描绘样式径直决定了后续结果器贪图较法的脱手着力和可膨胀性。
以强化学习为例,考验算法经常波及无数的迭代计较和高维数据贬责。
在这已经由中,算法很容易堕入重迭计较的泥潭,举例在每一步考验迭代中,皆从头计较样本间的范数距离、特征相同度等信息。
这种重迭性的计较不仅耗时,并且对计较资源形成了权贵的糜掷,严重制约了算法在践诺寰宇中的部署和应用。
因此,怎么高效、轮番地组织和描绘数据,以减少冗余计较、加快算法脱手,是数据驱动结果范式濒临的一项中枢挑战。
类比于模子轮番型,该征询初度提议,适用于数据驱动结果系统的轮番描绘样式:每条样本数据包含两个部分(如图 2 所示):

△图 2:数据轮番型默示图
(1)必要的鬈曲部分,即;
(2)可插拔的属性部分,举例奖励信号或其他东说念主工贪图特征。
前者蕴含了结果器贪图必要的系统的能源学信息,后者不错字据结果器贪图较法的需求来生动定制与取用,诽谤存储压力,加快算法脱手,即提高结果器贪图着力。
仿的确例
该征询给出了一个典型的数据轮番型应用实例。关于给定数据集,为了使得贪图出的结果器效果可靠,好多强化学习算法存在隔壁搜索的需求。
举例给定回放的样本景色,算法需要在线计较刻下计策的活动与数据集活动之间的距离:

由于需要遍历数据蚁集每个样原来寻找最隔壁,计较职守十分千里重。
在数据轮番型的视角下,关于每个样本,不错通过提前定制一种极端的空间属性,权贵加快隔壁搜索这已经由。
具体地,如图 3 所示,提前在样本空间中商定 n 个锚点,关于每个样本,计较其与各锚点的距离保存为空间属性。

△图 3: 轮番型的空间属性默示图
当每个样本皆具备空间属性后,该征询给出如下空间筛选要求定理来加快隔壁搜索。
定理 1(空间筛选要求)
商量一个包含个锚点的数据集。记 C 为一个选用的样本,而 S 为随心其他样本。若 S 位于 C 的 R- 邻域范围内,则一个需要恬逸的必要要求为:

其中流露流露逻辑与运算符。

△图 4:空间轮番型的空间筛选机制默示图
应用这一空间筛选要求,只需要一滑判断教唆,就不错快速松开候选范围(如图 4 所示),权贵加快最隔壁搜索的经由,从而提高算法的举座脱手着力。
该征询在 D4RL 数据集的 Hopper 环境下进行了实验,对引入空间轮番型前后的考验时辰进行了比拟。
图 5 明晰地展示了这一改造:基础版块(蓝色弧线)的考验耗时约 20 小时,而应用了空间轮番型筛选机制(橙色弧线)后,考验时辰镌汰至仅 7 小时,兑现了三倍的着力擢升。

△图 5:应用空间轮番型前后的考验时辰对比
总的来说,数据轮番型不错极小的存储空间支出,沟通权贵的时辰着力上风。
除此以外,它还不错字据算法需求生动插拔属性部分来诽谤存储需求,具备膨胀性,为提高数据驱动结果算法着力提供了新的场所。
论文荟萃:https://ieeexplore.ieee.org/document/11107988
一键三连「点赞」「转发」「留神心」
接待在辩驳区留住你的主张!
— 完 —
� � 点亮星标 � �
科技前沿推崇逐日见kaiyun官方网站
-
kaiyun中国官方网站他们还专门列出个数据-开云·(Kaiyun) 官方网站 登录入口 2025-10-30
-
别墅装修就在以色列空袭卡塔尔都门多哈之后-开云·(Kaiyun) 官方网站 登录入口 2025-10-30
-
kaiyun同比增长1222.38%-开云·(Kaiyun) 官方网站 登录入口 2025-10-30
-
kaiyun官方网站格式就更复杂了那样一来-开云·(Kaiyun) 官方网站 登录入口 2025-10-30
