悉尼科技大学(University of Technology Sydney, UTS)数据科学教授Amir H Gandomi正站在机器学习变革的前沿,他从自然选择学说中汲取灵感,研发着全新的技术工具。
查尔斯・达尔文的进化论早已助力生物学家与社会科学家,解释了生物如何进化并适应周遭世界。这一理论也为大数据与分析领域提供了灵感。
遗传编程(Genetic Programming)是一种强大的机器学习方法,它通过进化算法来解决复杂的数据问题。Gandomi教授是悉尼科技大学数据科学研究所的科研带头人,他正利用澳大利亚研究理事会授予的40万澳元探索早期职业研究者基金(Discovery Early Career Researcher Award),开发一种新的遗传编程方法。
“大多数机器学习技术的架构都是预先设定好的,而且存在局限性,但遗传编程有着独特的问题解决思路。它从零开始构建模型,借助进化机制筛选出有效模块,进而组合成一个全新的整体。这赋予了它无限的潜力。” 他说道。
“遗传编程不会只为一个问题寻找单一的解决方案,而是会生成一系列备选方案。这些方案会在多代迭代中相互交换信息,最终演化出更优的解决方案。”
他计划将遗传编程与信息论相结合,以此完善这项新技术。这一创新有望助力企业与政府,在智慧城市、物联网等海量数据密集型应用场景中,将庞杂的数据集转化为具有针对性、可落地的实用知识。
与此同时,他还提出了一个名为Alpha程序的新概念。
“我们正聚焦于每个解决方案在基因层面的特质,并找到了一种方法,能够追踪这些信息基因在多代迭代中的演变轨迹。这样一来,我们就能从不同的解决方案中提取最优基因,进而创造出性能最佳的终极方案。” 他解释道。
“这个过程有点像创造弗兰肯斯,我们打造出一个新个体,它汇集了其他方案的所有优势特质。这就好比,从一个人身上提取出敏锐的视力,再从另一个人身上提取出强健的臂膀,以此塑造一名优秀的运动员。”
Gandomi教授的学术背景是土木工程,他的专业生涯始于美国。在研究生阶段,进化计算提供的精妙解决方案吸引了他,让他踏入了数据科学领域。
他曾以团队成员的身份,参与过美国国家航空航天局格伦研究中心(NASA’s Glenn Research Center)的一个科研项目。该团队专注于机器学习领域的研究,致力于开发从自然界汲取灵感的工程解决方案。
“他们开展过许多极具吸引力的项目,比如受海豹启发设计的空气动力学装置,以及模仿蛇类或鱼类特性研发的传感器。能看到这么多从动物和自然中获得灵感的创新,真是太棒了。” Gandomi教授回忆道。
“这正是大自然的运行法则——万物皆通过进化来解决自身面临的种种难题。” 他表示,“我们正试图效仿自然,运用进化算法攻克复杂的现实问题。就像自然界的万物一样,我们也在不停地优化自己的解决方案。”
关闭