Blog¶
本站目前共记录 63 篇文章
3D生成模型 3DTopia/LGM 复现过程记录
约 766 个字 • 76 行代码
xformers版本与torch版本不匹配
按照README.md中的指示安装环境时,按顺序 pip install
之后,尝试运行时,显示了torch 2.1.0版本与xformers的要求不匹配的警告,
查看xformers版本为 0.0.26
,于是打算安装低版本的xformers,
安装时,发现会安装 2.1.1
版本的torch,于是就添加上了 --no-deps
的选项(不安装依赖),
再次运行,就没有版本不匹配的报错了
安装xformers后,提示torchaudio torchvision的版本不兼容了 · Issue #24 · 3DTopia/LGM (github.com)
继续阅读
记录第一次使用远程服务器
约 442 个字 • 4 行代码
起因
由于大创项目需要跑一个文生3D模型,于是给开了一个学校服务器的账号,
使用vscode连接
提到需要使用ssh方式连接,并且推荐使用MobaXterm和vscode,于是先搜索了如何使用vscode连接远程服务器,
参考了这个文章
继续阅读
使用百度AI的api
约 479 个字 • 25 行代码
由于RoboCup的Receptionist项目,需要通过视觉图像识别出志愿者身上的4个特征
如衣服的颜色、头发的颜色、性别和年龄至少 4 个特征
一开始打算寻找已经训练好的神经网络模型来进行识别,但是搜索了几个并尝试运行,效果也不是很好
继续阅读
尝试本地部署大模型(Llama 3)
约 569 个字 • 8 行代码
突然想尝试本地部署大模型,然后最近刚好同学又提到了Llama 3,于是搜索如何在本地部署这个模型,然后搜索到这个教程(还挺新的)
Windows(Win10、Win11)本地部署开源大模型保姆级教程-CSDN博客
按照这个教程安装好了Ollama、Hyper-V、Docker Desktop,并下好了Llama 3 8B (默认就是8B),
继续阅读
2024 RoboCup@Home What is that 项目准备记录
约 3124 个字 • 196 行代码
由于这个项目需要识别出手指向物体👉的手势,所以就在网上查找实现了相关功能的现成的库,
16日
查阅MediaPipe库说明
于是查到谷歌的MediaPipe库中有手势识别的功能,
继续阅读
借助typed.js实现网页打字效果
约 615 个字 • 86 行代码
由于在JetBrains Mono字体网页上看到了打字的动画效果,然后想将这个效果应用到手册首页的介绍文字上,于是开始进行尝试。
继续阅读
第一次使用vitepress搭建笔记/说明文档
约 1413 个字 • 126 行代码
起因
由于想在CS61A完成作业的仓库中把笔记放上,
并且之前又看到了不同的几个网站上都使用了很相似的网页的框架
(由于在这些网站上都没有找到关于生成的框架的信息)于是开始搜索可能的框架,
继续阅读
修改 mkdocs-material 代码块行号字体大小
约 162 个字 • 14 行代码
在预览发布 2024数模美赛参赛纪实(编程手视角) 时,由于之前都没有开启过代码块的行号显示,这一次是第一次开启,于是预览的时候发现行号和代码的大小没有对应上,
继续阅读