图书前言

前言

在智能建造与土木工程的快速发展中,计算机视觉与图像处理技术已成为解决复杂工程问题的关键工具。无论是自动化检测、结构健康监测,还是无人机和机器人辅助施工,计算机视觉正在提升建筑领域的效率与安全,为精细化建造和管理提供全新手段。

全书共9章,涵盖计算机视觉的基础知识、核心技术与实际应用。第1章介绍计算机视觉的历史背景与发展现状,探讨其在建筑规划、设计、施工和运营中的应用场景,Python与MATLAB环境配置指南及OpenCV核心模块解析; 第2章解析射影几何与图像形成的原理,涵盖二维/三维几何变换、相机投影模型及透镜畸变校正原理,结合数码相机的光学采样、色彩空间转换与压缩编码技术,构建从物理成像到数字信号转化的完整知识体系; 第3章讲解图像处理技术,涵盖图像金字塔、色彩空间转换、傅里叶变换等,帮助读者掌握图像操作流程; 第4章介绍视频处理技术,包括视频读取、摄像机调用和压缩编码,为目标识别、追踪和三维重建打基础; 第5章重点讨论目标识别与追踪技术,涵盖颜色的分割、轮廓特征分析与矩计算、特征点检测与运动估计算法等,广泛应用于施工场景中构件定位、位移监测与异常行为预警; 第6章探讨单目、双目和多目视觉系统,讲解立体视觉的物体定位与姿态估计; 第7章介绍计算摄影技术,包括高动态范围、超分辨率和去模糊技术,为高质量视觉数据采集提供支持; 第8章阐述三维重建技术,如运动恢复结构(SfM)和多视图立体(MVS),提升建筑模型数字化和可视化效率; 第9章探讨机器学习与深度学习在计算机视觉中的应用,赋予建筑智能化更多可能性。

本书旨在为土木工程和智能建造领域的学生、研究人员及工程师提供一份简明易懂的入门教材。通过介绍基础理论、算法和实际应用,读者将学习如何将计算机视觉技术应用于如图形处理、结构跟踪、三维重建、裂缝识别等实际问题。无论是初学者还是有经验的工程师,都能通过本书掌握前沿技术,应对智能建造领域的挑战。

计算机视觉技术自20世纪60年代兴起,早期研究集中在图像的边缘检测、形状识别等基础算法。如今,随着人工智能的发展,计算机视觉已在各行业广泛应用,并不断推进数字化和智能化进程。

作者在英国访学期间接触到计算机视觉在结构振动监测中的应用,发现这一技术在国内土木工程中的应用尚不充分,更多的研究和应用集中在其他行业。近年来,随着市场需求的变化,土木工程专业逐渐向智能化、数字化和网络化转型升级,重劳动力的需求显著减少,工程行业亟须解放劳动力、提高效率。智能建造的理念应运而生,计算机视觉作为智能建造中的重要新质生产力,发挥着不可或缺的作用。

土木工程的转型不仅是技术层面的革新,更是生产力的提升与社会需求的适应。因此,土木工程专业的培养目标应当充分考虑当前行业的发展需求与未来的职业挑战,除了扎实的土木工程基础知识和技能,学生还需要培养跨专业能力与创新能力,以应对智能建造和结构智慧运维带来的新要求,同时推动自身的综合素质提升。

当前计算机视觉教材多集中于数学或计算机科学领域,缺乏针对土木工程的应用指导。为填补这一空白,本书侧重于实际算法和代码实现,帮助读者快速上手,并将技术应用于智能建造和结构智慧运维中。通过本书,读者不仅能掌握计算机视觉与图像处理的基础知识,还能推动土木工程的智能化转型和可持续发展。

课程安排建议

本书为土木工程、智能建造或其他工程专业提供一个学期的计算机视觉与图形处理的入门课程。根据本书的内容,本课程可以规划为32学时或64学时。以下是建议的两种不同学时规划的课程表。

章节章 节 内 容32学时分配64学时分配

第1章计算机视觉概论24

第2章射影几何与图像形成24

第3章图像处理610

第4章视频形成与处理24

第5章识别与追踪48

第6章立体视觉与标定46

第7章计算摄影24

第8章三维重建48

第9章机器学习410

大作业授课老师自行布置26

配套与开源

本书在编写过程中,注重理论与实践的结合,力求为读者提供系统化的学习路径。本书的所有示例代码都已开源,并托管在清华大学出版社平台和Github平台上。读者可以通过访问Github平台、具体章节的二维码,获取最新的代码以及配套资源。“资源文件”二维码中的内容为例题所需资源文件,运行例题代码前请先下载资源文件。

资源文件

Anaconda

清华大学

开源软件

镜像站

Github平台

致谢

本书得以顺利完成并呈现于读者面前,离不开各方的支持与协作。在此,向所有在本书创作与出版过程中贡献智慧与力量的个人及机构致以诚挚的感谢。

本书由兰州理工大学朱前坤教授和广州大学刘彦辉教授作为主编,兰州理工大学李万润教授、南京工业大学王英副教授、沈阳建筑大学王琳琳老师和清华大学博士张道博作为副主编。具体编写分工方面,朱前坤负责第1~5章,刘彦辉负责第6章,李万润负责第7章,王英负责第8章,王琳琳、张道博负责第9章。

同时,衷心感谢参与本书编写的学生,感谢研究生白雪松和谢辰辉作为主要参与者贯穿全程; 以及研究生顾雨馨、王军营和周叙霖等的积极参与和贡献。此外,感谢清华大学出版社编辑团队的大力支持与协助,他们专业的编辑与校对工作确保了本书的顺利出版与阅读体验。感谢在本书编写过程中提供资料和代码支持的所有参考内容作者,以及OpenCV库等的开源代码,他们的慷慨分享为本书奠定了坚实基础。

最后,感谢所有关注与支持本书的读者,由于编者的水平和时间有限,书中难免有不当之处,敬请广大读者评判指正,期望本书能为相关领域的研究者与实践者提供有价值的参考与启示。

作者

2025年6月