跳转至

Configure & Debug

尝试使用Github Action自动更新submodule

约 472 个字 • 46 行代码

由于之前有在一个仓库中添加submodule,而如果submodule更新了,父仓库还需要在本地将submodule同步,然后在commit和push。觉得很麻烦,于是搜索有没有能自动化完成这些操作的办法,发现了这个帖子

最高赞回答是Artur A的回答,提到的方法是,在父仓库中创建一个workflow,可以更新所有的submodule并push,再在submodule中创建另一个workflow,它在submodule被推送时去触发父仓库中的workflow。

实现使用Github Action自动同步fork的上游仓库

约 649 个字 • 160 行代码

把同学写的一个仓库fork到了github组织当中。但是同学每次更新,在组织中的仓库都需要手动同步一下,觉得很麻烦,于是开始在谷歌上搜索。

过程中有看到这篇帖子,但是最后没有采取最高赞的回答的方法。

最后找到了这个仓库/action应用

通过实现在Github Action中将文件推送到另一个仓库中,实现private文档仓库构建的页面自动部署到public仓库中

约 2346 个字 • 140 行代码

因为想要构建的网页包含密码,而我又想使用github action来在main分支推送时自动构建页面,所以存储文档的仓库中就需要包含设置密码的 passwords.yml,因此仓库的属性就需要设置成private(要不然直接翻仓库就能看到密码了😅)。

而免费的github的组织中,private的仓库不能开启github pages,所以一种办法是(文档存储在private仓库中而)把构建的页面放置在另一个public的仓库中(另一种办法就是直接氪金)。又因为我想要只推送一次文档就可以让github action自动部署好(懒惰是人类进步的阶梯),所以就有了这次的记录。

实现麦克风录音并使用faster-whisper无文件读写地进行语音识别

约 1459 个字 • 203 行代码

前两天在搜索比较快速/轻量的语音识别模型时,发现了faster-whisper,测试了一下发现居然使用cpu也能跑,并且速度不慢准确率也不低。

由于我的应用场景中是需要使用麦克风先进行录音然后再进行识别的,faster-whisper官方仓库中给出的示例使用代码是读取文件进行识别的

询问DeepSeek如何实现服务器上根目录自动跳转到一级目录的记录

约 2811 个字 • 150 行代码

由于之前使用宝塔面板在服务器中部署了博客,但是把博客放在一级目录下(因为没域名😅,用多个一级目录就可以部署多个网页),而根目录中的 index.html 是宝塔面板默认生成的页面,如果要修改也想不到什么好的想法,就想着从根目录直接跳转到博客里算了。

于是去询问DeepSeek

查看PyRealSense2包中的类和函数

约 385 个字 • 826 行代码

由于想要在编写的代码中声明类型(方便在使用自己编写的函数时,查看返回的类型),于是开始查看pyrealsense2包中的代码,然后发现只有一个 __init__.py

pyrealsense2/__init__.py
# py libs (pyd/so) should be copied to pyrealsense2 folder
from .pyrealsense2 import *

__init__.py 路径下是 pyrealsense2.cp310-win_amd64.pyd 文件,就意识到这是一个使用c++编写的库(而python只是将其进行了封装),所以无法直接从源代码中查看库中的类和函数。

编写GitHub Actions工作流实现MkDocs网站自动化部署到云服务器

约 3273 个字 • 167 行代码

由于之前Gitee停止了Pages服务,国内访问Github Pages页面比较慢,所以想将用MkDocs生成的blog网页部署到之前买的云服务器上(就能方便在国内进行访问)。但是blog又不时会进行更新,所以询问DeepSeek是否有比较方便的部署方法

获取Azure Kinect摄像头的内参

约 645 个字 • 23 行代码

由于同学需要摄像头的焦距等参数来将深度帧的数据转换成3维坐标系中的坐标,所以开始在网上搜索相应的方法

一开始找到了这篇文章,

Azure Kinect 获取相机内参 - BuckyI - 博客园 (cnblogs.com)

但是安装了pykinect_azure包后,运行文章中的代码出现了报错,就放弃参考这篇文章了

在Python中实现使用MediaPipe摄像头视频流识别手势并显示标注图像

约 490 个字 • 141 行代码

由于mediapipe官方的文档以及python的代码示例中,

没有给出摄像头视频流检测的代码,代码示例中只提供了对4张示例图片进行检测的代码,于是开始参考代码示例进行代码的编写。

重新编写视觉模块记录

约 3412 个字 • 265 行代码

由于以前的视觉部分的代码看起来很💩(感觉代码文件的结构很混乱,不够易读),于是打算重新编写新的。

我先是分别询问了chatgpt和copilot关于如何在摄像头一直保持开启的状态下,切换使用不同的功能