大数据挖掘分析与应用
1、航天任务大数据分析与应用
基于航天任务丰富的大数据资源,通过机器学习等方法,开展基于语义信息的空间科学与应用数据智能化检索技术研究,实现基于图像/视频等内容的语义检索;利用机器学习和数理统计算法,综合利用多模式成像体制中的多维特征,实现数据信息提取,满足应用研究需求;以深度学习目标检测与跟踪技术为核心,实现对科学实验数据的在线智能化分析;以三维实时渲染技术为依托,利用数据可视化方法,实现数据在线可视化及分析,完善数据展示方法和工具。
(1)长时序对地观测图像质量分析平台
长时序对地观测图像质量分析平台:针对外部环境或内部因素的变化导致的航天对地观测载荷性能变化和数据质量变化情况,利用长时间序列对地观测数据质量变化趋势分析及影响因素分析方法,定量评价(以清晰度、信噪比和坏线数为例)对地观测数据质量,在此基础上对图像质量进行趋势分析,将工程参数与对地观测图像数据质量进行关联规则挖掘,结合其他辅助分析方法,分析对地观测图像质量变化的主要影响因素,为图像质量变化预测和分析载荷在轨情况提供支持。
图1 长时序对地观测图像
图2 图像信噪比与清晰度影响因素关系图
(2)典型目标特征识别与检索
“典型目标特征识别与检索” 技术系统面向海量空间观测数据,利用高分辨率全色、多光谱、高光谱等多种空间观测数据,以及典型目标的照片图像与仿真图像,构建典型地物目标(包括典型建筑物、人文景观目标)多源数据库,通过特征高精度提取、目标特征高效识别,针对北京市区域内的多种典型建筑、人文景观等地物目标完成照片、仿真图像、空间对地观测图像的综合识别与互搜索,并结合相关知识库信息对搜索结果进行综合展示。
系统实现的普通图像与对地观测图像之间的信息融合与互搜索技术,在国内乃至国外均具有突破性意义,取得了国内外计算机视觉领域的广泛关注。
图3 典型目标特征识别与检索
2、农业遥感大数据分析与应用
通过卫星遥感影像、无人机监测等技术采集并监测农作物生长信息是现代农业生产的发展趋势,利用深度学习与数据可视化技术,在农业遥感按需服务系统技术与农业遥感反演技术方面进行创新性的尝试,构建从专业技术方法到服务模式的技术体系,帮助农业生产者和农业管理部门了解农业状况,提升生产效率、降低管理成本。
农业遥感应用大数据综合服务平台:利用定量遥感与WebGIS技术,采用B/S与手机App两种模式研发,以按需服务模式为农业用户提供农作物种植面积统计、农田干旱监测、农作物典型病虫害监测、农作物长势监测与农作物估产等农情信息产品。通过平台建设,已积累了一套成熟稳定的农业遥感大数据服务系统开发模式,在农业遥感应用中具有广阔的应用前景。
图4 农业遥感应用大数据综合服务平台
3、环境质量大数据建模与应用
面向环境质量监测、城市功能评估等行业应用需求,针对海量数据的增长速度,开展海量数据挖掘、知识发现领域的研究,根据数据类型,业务场景及需求,研究相应的大数据建模过程与方法,通过不断选择、训练、评估、应用和优化模型,推进大数据分析建模的理论方法和环境质量大数据的行业应用。
研制开发的“江苏省环境质量大数据地理可视化平台”和“江苏省环境质量大数据联动分析与可视化平台”,实现江苏省“空气质量—企业排污—税收”的联动调控,有效综合评判环境质量,揭示空气质量、区域污染与经济增长的关系,为环境治理提供重要的决策依据;探索了环境质量大数据驱动的示范应用,推进多源海量遥感、气象、环境、经济、社会等大数据的融合挖掘和可视化创新展示。
图5 江苏省环境质量大数据地理可视化平台及联动分析
4、体育大数据分析与应用
面向体育信息化发展的推动以及体育资源整合的需求,开展建设体育资源信息大数据平台,对体育资源共享来说非常重要,提出基于大数据的体育信息系统研究,依托大数据整合优质体育资源,构建体育大数据环境,建设针对体育行业的数据分析与应用云信息平台,充分挖掘分析体育资源信息大数据,提升体育管理信息系统的决策能力和智能化水平。
研制开发的“中国反兴奋剂教育平台(CADEP)”,实现运动员不同职业生涯阶段兴奋剂监测、教育等数据的汇集管理,研究建立兴奋剂大数据监测分析模型,跟踪运动员运动生涯关键指标,为终端管理者提供决策支持。通过一站式大数据管理与应用为体育机构和组织提供大数据解决方案,助力体育机构和组织突破现有数据系统的各种瓶颈,引领体育大数据技术方向,打造大数据核心平台,整合体育数据,提供全方位的大数据服务。
图6 中国反兴奋剂教育平台(CADEP)
附件下载: