学习了哪些知识,计算机视觉才算入门发表时间:2023-03-06 09:57 学习了哪些知识,计算机视觉才算入门? 计算机视觉,与语音识别、自然语言理解,并称为人工智能的三大主要技术领域,也是AI技术落地产业化最广泛的领域。 计算机视觉主要分为2D视觉和3D视觉两大研究领域,2D视觉的研究内容包括:目标识别、目标跟踪、视频内容理解等;3D视觉的研究内容包括:基于图像的三维重建、目标三维姿态估计等。 3D视觉研究内容 从结构出发: 当下,除了图像去噪等少数方向,2D视觉领域几乎被基于学习的方法统治;3D视觉领域仍以基于几何的方法为主,虽然最近也出现了不少基于学习的方法的paper。 基于学习的方法,主要是指以深度神经网络为主的深度学习,主流编程语言为Python;基于几何的方法,由于需要较快的运算速度,主流编程语言为C++。 从知识出发: 无论是2D视觉,还是3D视觉,其需要的基础知识主要包括:数学基础、编程基础、视觉基础。数学基础包括高等数学中的函数求导部分、概率统计、线性代数、凸优化等,编程基础主要包括Python或者C++,视觉基础主要是图像处理。 具备上述基础后,再细分计算机视觉领域的方向,如目标检测、目标识别、目标跟踪或者三维重建、视觉SLAM等。在细分领域进行研究,阅读相关经典文献,复现代码,并及时整理总结。 这时,算是真正入门了。 四川广泰科技公司有成熟的机器视觉工程师团队,为客户的工业应用打造个性化的视觉方案。请关注我们微信公众号留言~ |