用 MCP 让大模型自动批量解读文献,保姆级教程来了!
零: 来源 https://mp.weixin.qq.com/s/VuuMaA73jeNYHaD-X1toCwMCP 最近这么火,你还不知道它是啥吗?别慌,动手实战一番就包你明白了。 你有没有想过让大模型自动给我们搜索、下载、解读文献,一条龙服务?即便像 Deep Research 之类的服务也主要是帮你搜索和整合资源,但不给你下载资源对不。 实际上,是可以手撸一个智能体帮我们干这项大工程的。只是现在不是流行 MCP 嘛,咱们也想通过这种方式来建一个。 马上给你安排上。 本篇将以 arxiv 为例,目标是让你发个话,智能体就帮你搜索、下载文献,甚至解读一条龙到家。 为了照顾不同需求,咱这里贴心地实现了两套方案, Trae CN + Cline,功能强大 Cherry Studio,容易上手 当然,如果你喜欢的话,也不拦着你直接用 Python...
pip 扫描路径的问题
有一次遇到了一个不管在什么Python路径下,使用pip list都会出现一个系统目录下的所有的python源的问题,反复使用anaconda安装和卸载环境也不好用 发现问题的过程: 正常的python -m site输出1234567891011> python -m site # base环境下 sys.path = [ '/home/tipriest', '/home/tipriest/anaconda3/lib/python311.zip', '/home/tipriest/anaconda3/lib/python3.11', '/home/tipriest/anaconda3/lib/python3.11/lib-dynload', '/home/tipriest/anaconda3/lib/python3.11/site-packages', ] USER_BASE:...
多传感器融合SLAM方法研究
香港科技大学-袁博院子康 ORB-SLAM这个工作三篇DSO的这个工作含金量很足,从应用和工程价值都很足VINs-Mono 沈邵杰 秦通什么是LIVO,为什么叫LIVO? CT-ICP 把一个lidar的sweep同时用开始和结束状态来表示,解决啥鸡生蛋还是蛋生鸡的问题LIVO主要是张富老师团队的作品FAST-LIO和之前的求解量是三倍以上的往下降,主要是卡尔曼滤波处的一个问题的….激光雷达的sweep主要是100ms一次的sweepIG-LIO已经能够以20ms完成一个sweep的处理 这个时候激光雷达固有的比较低的频率成为了瓶颈 前向传播是IMU的值来做积分做的,反向传播是雷达反向传播的修正 SDV-Norm,不能实时,后面的加速播放 张富老师实验室开源的一个数据集
空间理解模型SpatialLM
8000多个小时,有笔误 打标的方式,笔刷先刷面然后再框BOX怎么看真实性:应该在一起和不在一起的东西在不在一起,看热力图的数据支持大约60种类别物体的输出⚠️upload failed, check dev console训练一个VLM,把图片的编码变成一个3d点云的编码,不是很复杂,这样通过 interior net的数据集也是一个很大的数据集,数据来源都是酷家乐设计师的一个来源能够转成各种各样的数据,数据获取方式有一点不同 重建点云的时候,用一些离线建模的方法会不会更准一些?CoMap + MVS,点云重建的算法 想到饿了么的那个比赛是不是可以先重建一下,但是是单帧的 输入是一个点云,输出是一个Box训练时间和训练的卡数 Spatial Verse里面也有一些重力,碰撞检测等等Spatial和SpaceVerse结合生成更真实的物理模型 先冻结LLM模型,先调整VLM LLM Projector然后更进一步再放开,调整LLM模型,提高模型输出的精度思路和Qwen...
faiss库介绍
Faiss(Facebook AI Similarity Search)是由Meta(原Facebook)开发的高效相似性搜索和密集向量聚类库,专为处理大规模向量数据设计。以下是其核心要点: 1. 核心功能与优势 高效检索:支持亿级向量的毫秒级搜索,尤其适合高维数据(如文本、图像嵌入向量)。 多算法支持:提供多种索引类型(如IVF、HNSW、PQ),平衡速度、精度和内存。 跨平台:支持CPU/GPU加速,提供Python和C++接口,适配不同硬件环境。 内存优化:通过量化(如乘积量化)减少内存占用,支持非RAM数据。 2. 安装方法 Linux:1234# CPU版本pip install faiss-cpu# GPU版本(需CUDA)pip install faiss-gpu Windows:需通过Conda安装:12conda install -c pytorch faiss-cpu # CPUconda install -c pytorch faiss-gpu # GPU 3. 基础使用示例3.1...
gradio库介绍
以下是Python的Gradio库的详细介绍,结合参考资料及实际应用场景整理: 1. 概述Gradio是一个开源的Python库,用于快速构建机器学习模型、API或任意函数的交互式Web界面。它无需前端开发经验,仅需几行代码即可生成可视化演示应用,支持文本、图像、音频、视频等输入/输出类型,适合模型测试、原型展示和教育工具等场景。 2. 核心功能 快速搭建界面:通过gr.Interface或gr.Blocks快速定义输入输出组件(如文本框、滑块、图像上传)。 多模态支持:支持文本、图像、音频、视频、文件等多种数据类型交互。 实时交互:用户输入实时触发后端函数处理并返回结果。 共享与部署:生成可公开访问的链接(如share=True),支持本地或远程服务器部署。 3. 安装方法1234# 安装最新版pip install gradio# 升级版本pip install --upgrade gradio 4. 基础使用示例4.1 简单文本处理1234567891011import gradio as grdef greet(name): return...
openai库介绍
以下是Python的openai库的详细介绍,结合参考资料和实际应用场景整理: 1. 概述OpenAI Python库是OpenAI官方提供的工具包,用于通过Python代码便捷访问OpenAI的各类AI模型(如GPT系列、DALL-E、Whisper等)。它封装了REST API请求,支持文本生成、图像创建、语音处理等任务。 2. 安装与版本管理安装12# 使用pip安装最新版(Python 3.7+)pip install openai 版本检查: 1pip show openai # 查看版本(示例输出:Version: 1.25.0) 虚拟环境(推荐)1234# 创建并激活虚拟环境(Windows)python -m venv venvvenv\Scripts\activatepip install openai # 在虚拟环境中安装 3. 配置API密钥方式1:直接设置12import openaiopenai.api_key = "sk-your-api-key" # 替换为实际密钥 方式2:环境变量(更安全)12#...
混合场景抓取-许可淳
混杂场景下物体的抓取和放置,通用机器人抓放 可能对末端位姿有明确要求非预编程 能够观察物体 需要很少的探索 能够根据图纸干活大模型很难从交互中自我学习模块化的拼接会收到模块化的累计误差的影响 采集数据-每一个场景都采集-可能需要上百种场景,上百万的数据 提出了一个Action Foundation Model,给定这样的Action Priors,是不是能够通过少量的学习达到更好的效果 抓和放通过同样的一套网络并且share它们的参数来实现多峰问题有很多个动作科学,动作具有多峰分布的特点,但是采集的时候很难都采集到弥补place action的多峰分布的问题 Unconditioned Action Prior把整个问题建模成为一个Uncondition Action Prior的框架 给定目标图像,机器人将目标物体从混杂的场景转移到目标场景 涉及到一定的物体先后专访,buffer,一个长序列的学习问题 Qs: 抓取实验,做实验有没有考虑过更复杂的情况,背景和物体有类似的纹理...
模式匹配-修改文件名称
1234567891011121314151617181920212223242526272829303132333435363738394041import osimport redef rename_files(directory): """ 重命名目录中符合模式('...', '...').txt的文件为第一个参数+.txt格式 参数: directory (str): 要遍历的目录路径 """ # 匹配形如('内容1', '内容2').txt的文件名模式 pattern = re.compile(r"^\('([^']*)',\s*'([^']*)'\)\.txt$") for root, _, files in os.walk(directory): for filename in...
强化学习腿足控制和导航:兼顾敏捷和安全
有一些还没有发现的控制和整合上的工作,让机器人不如动物敏捷 手脚并用 感知结合 神经网络结合本体感受进行修正 放弃多层的方案,直接输出关节的动作,因为上层的控制器不知道底层控制器跟的有多好,底层控制器不知道上层控制器做的有多好,没办法联合优化 可以让机器人的脚和小石头做接触,传统控制是做不到的 鲁棒性传统控制器在遇到一些雾的情况下怎么办在sensor degradtion的情况下进行导航 未来RL在腿足机器人领域可能颠覆哪些传统技术? 传统控制(已经)+感知/导航(ongoing) 敏捷:RL + goal-reaching, more cases,用了哪一个仿真平台?部署强调“onboard sensing and computation”,采用了哪一家的硬件以及算力大小? Issaac Gym Orin,有的时候用多个 具身智能领域RL的主流技术路线有哪些?如何与大模型衔接? 让奖励变得更容易学 VLA加RL,把Policy做很大的模型,后面训练, ...