智能查重方法在建设项目环评文件技术复核中的应用探讨Research on Intelligent Duplicate Checking of Environmental Impact Statements of Construction Projects
高爽;刘梅;屈加豹;王苏滨;韩鑫勇;康运峰;吕巍;卢力;
摘要(Abstract):
基于大数据和语义识别、深度学习等人工智能技术,创建了一套智能查重方法,用于辅助环评文件的人工技术复核。介绍了智能查重方法的体系、算法和功能,并将该方法应用到环评文件技术复核中,分析了典型环评文件案例存在的问题。本研究创建的方法是人工智能技术在环评领域的创新应用尝试,通过聚焦环评文件的抄袭行为,实现对环境影响评价报告书(表)质量的初步筛查,对查处抄袭行为、惩治弄虚作假具有一定现实意义。
关键词(KeyWords): 环境影响评价报告书;智能查重;技术复核;环境保护;建设项目
基金项目(Foundation):
作者(Authors): 高爽;刘梅;屈加豹;王苏滨;韩鑫勇;康运峰;吕巍;卢力;
DOI: 10.14068/j.ceia.2021.06.005
参考文献(References):
- [1]覃雪波,卢昌斌.浅析近期环评文件技术复核概况[J].资源节约与环保,2019,209(4):184-189.
- [2]易爱华,伯鑫,丁峰,等.钢铁行业大气复核要点及案例分析[J].环境影响评价,2014,36(6):37-39.
- [3]窦方坤,曹皓伟,徐建良.基于文本元素的PDF表格区域识别方法研究[J].软件导刊,2020,19(1):11-116.
- [4]唐皓瑾.一种面向PDF文件的表格数据抽取方法的研究与实现[D].北京:北京邮电大学,2015.
- [5]王苏滨,张泽焕,汪红宇.显示控制群中大规模控制的形式方法[J].控制理论与应用,2011,28(6):881-884.
- [6]王学梅.OCR文字识别系统的应用[J].现代信息科技,2019,3(18):66-68.
- [7]姚鹏威.基于数字图像处理的表格识别[D].郑州:郑州大学,2019.
- [8]刘咏彬,王小捷,袁彩霞,等.基于语义冲突检测的机器阅读理解网络(英文)[J∕OL].北京邮电大学学报,2019,42(6):126-133.[2020-03-06].https:∕∕doi.org∕10.13190∕j.jbupt.2019-202.
- [9]吴芳,郑君,刘金亮,等.基于GATE框架的中文信息抽取技术的研究[J].电脑知识与技术,2009(5):6857-6858.
- [10]UIJLINGS J R,SANDE K E,GEVERS T,et al.Selective Search for Object Recognition[J].International Journal of Computer Vision,2013,104(2):154-171.
- [11]韩敏,唐常杰,段磊,等.基于TF∕IDF相似度的标签聚类方法[C]∕∕第26届中国数据库学术会议论文集(A辑).南昌:中国计算机学会数据库专业委员会,2009:417-422.
- [12]张金鹏.基于语义的文本相似度算法研究及应用[D].重庆:重庆理工大学,2014.
- [13]张小川,于旭庭,张宜浩.一种改进的向量空间模型的文本表示算法[J].重庆理工大学学报(自然科学),2017,31(1):87-72.
- [14]曹灿,赵方,陈航.基于权重树的领域本体片段相似度算法[J].计算机工程与设计,2010,31(20):4347-4349,4413.