SpatialLM 是一个强大的 3D 语言模型,能够将来自视频、RGBD 图像或激光雷达的复杂 3D 点云数据转化为清晰、结构化的 3D 场景布局,显示墙壁、门、窗以及带标签的物体。它无需特殊设备即可工作,并且能够检测用户指定的物体类别。这有助于更好地理解和分析室内空间,广泛应用于机器人技术、导航和 3D 设计等领域。用户可以将其应用于自己的数据,直观地可视化结果,甚至轻松定制检测任务,使得 3D 场景理解变得更加易于访问和灵活,适用于多种应用场景。
#python #mllm #point_clouds #scene_understanding #spatial_intelligence #Git202508151230