Yan 的杂物志_个人主页分享

Created2023-11-15|2_Note0_Technic0_工具编程工具

ChatGPT-CodeReview 是一个开源项目，目前 (231115) 3.2k Star，它可以作为 github 的应用（类似插件），通过调用 ChatGPT，在提交代码时，帮助审查代码中的错误。 1 github 地址&说明文档 https://github.com/anc95/ChatGPT-CodeReview/blob/main/README.zh-CN.md 2 安装 https://github.com/apps/cr-gpt 自己项目的 Settings->Security->Secrets and variables->Actions 切换到 Variables 选项，创建一个新变量 OPENAI_API_KEY 3 使用使用 pull request 方式，在自己的项目中 Pull request 选项卡中 create pull request，选择要合并的分支。程序会自动触发代码审查，审查信息将显示在 file changes 中。 4 注意这是一个基于 github 的应用，无需本地部署，在 github 上安 ...

Linux调试Android手机

Created2023-11-15|2_Note0_Technic3_编程Android工具

1 安装工具 1$ sudo apt-get install adb 2 开启 USB 调试 2.1 一般方法打开 " 开发者选项 "：设置界面 ->系统管理 ->关于手机 ->版本信息，多次点击“软件版本号“，直到系统提示已经启用了开发者选项。设置界面 ->系统管理 ->开发者选项勾选”开发者选项“，勾选 "USB 调试 2.2 我的手机我的手机 VIVO X50 Pro，具体操作如下：关于手机 ->版本信息 ->多次点击软件版本号设置界面 ->系统管理 ->开发者选项（无法通过搜索功能找到）打开”开发者选项“和”USB 调试“ 3 连接手机在命令行输入： 1$ sudo adb shell 在手机的弹出框中选”允许连接“ 此时至少可以访问 /sdcard 存储卡上的内容 4 注意如果使用 Linux 环境，尽量在连接时关闭 Windows 虚拟机，否则 USB 连接可能直接被映射到 Windows 系统中。打开开发模型后手机可能变慢，不使用时请酌情关闭。

模型社区_Huggingface

Created2023-11-14|2_Note0_Technic0_工具大模型

1 介绍 Hugging Face 是一个开源模型社区。目前已经共享 300k+ 模型，100k+ 应用，50k+ 数据集（截至 231114 数据），可视为 AI 界的 github。 2 官网 https://huggingface.co/ 3 主要功能 3.1 Models 模型大家都用过就不赘述了，用法和 github 差不多。 3.2 Datasets 数据集大家都用过就不赘述了。 3.3 Spaces 应用程序主要用于 Demo，可把 AI 应用部署到 Huggingface。构建 Space 方法见：Spaces Overview，请先看网页中的视频，相当简单。运行时使用 HuggingFace 的资源，少量使用时免费，大量使用时付费。默认情况下，每个 Space 环境限制为 16GB RAM、2 个 CPU 内核和 50GB（非持久）磁盘空间，可免费使用。在免费硬件上，如果未使用，空间将“进入睡眠状态”，并在一段时间后停止执行。也可以在其上购买更多资源，详见：The simplest way to access compute for AI。国内使用的时候 ...

实测_GPT_Assistant

Created2023-11-14|2_Note0_Technic0_工具大模型OpenAI

1 资源 openai 客户端源码： https://github.com/openai/openai-python/ openai 各种 API 示例： https://platform.openai.com/examples assistant 示例： https://platform.openai.com/docs/assistants/overview 2 Assistant 功能代码解释器检索功能函数调用 3 操作步骤 (较之前的 api 略复杂) 升级 openai api 1pip install --upgrade openai 创建 Assistant，定义其 instruction 并选择模型，如果需要，设置代码解释器、检索和函数调用功能。 123456assistant = client.beta.assistants.create( name="Math Tutor", instructions="You are a personal math tutor. Write and run code t ...

OPENAI的语音识别

Created2023-11-13|2_Note0_Technic2_算法1_音频

1 使用感受效果还不错，价钱也不贵，少量使用时好过自己搭环境。尽管其底层模型 whisper 是开源的，但自己搭个环境，如果不常用，还老得开着机器，也不划算。 2 使用方法 123456789from openai import OpenAIclient = OpenAI(api_key=API_KEY)audio_file= open("/opt/xieyan/share/date/231012/test5.m4a", "rb")transcript = client.audio.transcriptions.create( model="whisper-1", file=audio_file)

本地部署_ASR工具_Whisper

Created2023-11-12|2_Note0_Technic0_工具其它

1 简介 Whisper 是 OpenAI 的语音识别系统（几乎是最先进），它是免费的开源模型，可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 运行 1nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu image 大小：11.5G 运行后，即可在 9000 端口通过 swagger 调用，我先用手机录了一些简单的中文，识别效果还不错，除了第一次调用时可能是下载和加载模型时间比较长，后面再调用速度就很快。又用它识别了一个 25 分钟的 mp3（约 27M），是一位小哥哥 B 站视频对应的音频文件，识别时间约为不到 1 ...

Python判断是哪种语言

Created2023-11-12|2_Note0_Technic3_编程Python工具

12345678910111213from langdetect import detecttext = "你好，世界"#text = "坐禅はツール"text = "[のか](part0018.html#_idParaDest-31)：身体感觉是真实的吗"language = detect(text)if language == 'zh-cn': print("这是中文文本")elif language == 'ja': print("这是日文文本")else: print("这不是中文或日文", language)

OPENAI 开发者大会_观后感_231107

Created2023-11-07|2_Note0_Technic6_思考

GPT4 Turbo 功能 Token 更长 3.2W->12.8W 个 token 很好，但影响不是很大，一次传那么多也很贵 JSON 响应，对程序更友好 GPT3.5 的 JSON 已明显好于其它模型，更进一步检索功能 + 分析资料 +2023.4 月知识库之前这些功能由外围提供，纳入外围多模态集成之前大家自行实现，降维打击，构建生态 GPT-4 fine-tuning 不知道能做成什么样？如何收费？速度 x2, 版权问题，定价 1/3（真材实料）输入 token 价格 0.01 美元 / 1000 token 输出 token 价格 0.03 美元 / 1000 token 开发与周边产品结合：执行程序 Agent & 定制 GPT 应用，demo 一些应用场景更丰富的 API，集成了之前的外围功能，可以和函数交互，和文档交互，历史记录新的交互的方式，像一个身边的助手，除了问答，还可以作为 agent 执行操作，接入应用一些思考看了两遍，第一遍挺震惊的；冷静下来又细看了一下作为 OPENAI，做到 GPT-4 ...

Web服务_Nginx

Created2023-10-31|2_Note0_Technic3_编程前端

1 Nginx Nginx（发音为 "engine x"）是一个高效的开源 HTTP 服务器和反向代理服务器。作为 HTTP 服务器，Nginx 的功能类似于 Apache，它可以将静态网站内容提供为 HTTP 服务，即创建网站。反向代理的概念可能不太容易理解，让我们通过两个典型的场景来解释一下：在客户的场地内，我们可能需要启动多个端口的 Web 服务，但客户只允许我们打开两个端口。我的博客和公众号服务都需要在 80 端口上运行，但它们是两个完全不同的程序，不方便合并代码。在这种情况下，我们可以使用 Nginx 作为中间的转发。例如，我们可以将所有以 /wx 为相对路径的请求都转发到运行在 8082 端口的公众号服务上，其余的请求则被视为博客请求，转发到运行在 8083 端口的博客服务进行处理。 2 使用 Docker 运行 Http 服务作为 Http 服务使用时，推荐以下方法： 2.1 安装 docker 镜像 1$ docker pull nginx docker image 很小，仅需要 187 M 2.2 启动 nginx 服务 1$ docker run -- ...

代码规则化工具 Black Formatter

Created2023-10-29|2_Note0_Technic0_工具编程工具

1 说明用途：规范化代码格式 2 VSCode 在 VSCode 中安装 Black Formatter 插件打开.py 文件，在文件空白处右击，选择格式化文档，该文档自动完善格式。注意 VSCode 有自己的格式化工具，所以用 VSCode 写的代码格式都还行，主要处理其它不太规范的化码不支持 ipynb 文件 3 命令行 pip install black black xx.py 4 说明我个人更喜欢命令行方式