Yan 的杂物志_个人主页分享

Created2023-12-01|2_Note0_Technic3_编程数据库

1 介绍 Redis（Remote Dictionary Server）是一个开源的内存数据存储系统，可以用作数据库、缓存和消息中间件。它支持多种数据结构，包括字符串（strings）、哈希表（hashes）、列表（lists）、集合（sets）、有序集合（sorted sets）等。 2 使用场景相对于使用数据库，它读取更方便，时间更短相对于存储在硬盘上，它可供不同机器上的不同客户端读取。 3 使用方法 3.1 安装运行 12$ docker pull redis$ docker run --rm -d --net host redis 默认端口是 6379 3.2 Python 客户端 12345678910111213import redisredis_client = redis.StrictRedis(host='localhost', port=6379, decode_responses=True)# 尝试从缓存中获取结果cached_result = redis_client.get(f'test:01')if cache ...

gitbook制作电子书

Created2023-11-25|2_Note0_Technic0_工具笔记工具

1 引言 GitBook 是一个开源的文档编辑和托管平台，用于创建和维护文档、手册和电子书。它基于 Markdown 和 Git 技术，帮助用户方便地编写、编辑和发布文档。 GitBook 支持将文档输出为多种格式，包括网页、PDF、ePub 等，适用于不同的阅读和分享场景。 GitBook 还提供了团队协作的功能，可以方便多人共同编辑和维护文档。可以将其部署在 gitbook 平台（https://legacy.gitbook.com/），由于需要科学上网，本文不做详细介绍，如果需要，请见最后的参考部分；也可以部署在本地或者自己的网站上。从功能角度，可以把 gitbook 看作网页版的 obsidian 或者 hexo。gitbook 工具实现前端，用户只需要关心文档的内容，遵循 gitbook 定义的规范，然后使用 gitbook 提供的命令行工具即可。从逻辑角度看，它以主题为中心，可以把一个系列的文章梳理集中在同一主题之下，更有章法，适合用来写书或者手册。利用 gitbook，很容易将一堆文档（比如团队 markdown 文档，培训文档）生成类似 wiki 的网页展示，风 ...

论文阅读_生成式Agent

Created2023-11-21|2_Note0_Technic2_算法7_模型增强AgentAgent论文

12345678英文名称: Generative Agents: Interactive Simulacra of Human Behavior中文名称: 生成代理：人类行为的交互式模拟文章: http://arxiv.org/abs/2304.03442代码: https://github.com/joonspk-research/generative_agents作者: Joon Sung Park机构: 斯坦福大学日期: 2023-08-05 (预发表时间：2023.4)引用次数: 231 读后感这篇文章非常具有启发性，很多点都可以引发进一步思考和研究，比如在产品设计方面：定制反映自己特点和经验的计划助手；在结构设计方面，提出三个组件：记忆、反思、计划的架构，用于存储、合成和应用相关记忆，根据这些原则，应对各种复杂的场景。在具体实现方面还在附录中给出了一些可用的提示信息。其中有两个实验结果很有意思，一个是：如果没有观察、计划和反思，仅有一般性的知识，模型性能将大打折扣；另一个是：”你会选择谁共度一小时“，如果不加反思，结果是最频繁交往的人，反思之后是深层价值观相似的人。 ...

编程助手_代码审查机器人

Created2023-11-15|2_Note0_Technic0_工具编程工具

ChatGPT-CodeReview 是一个开源项目，目前 (231115) 3.2k Star，它可以作为 github 的应用（类似插件），通过调用 ChatGPT，在提交代码时，帮助审查代码中的错误。 1 github 地址&说明文档 https://github.com/anc95/ChatGPT-CodeReview/blob/main/README.zh-CN.md 2 安装 https://github.com/apps/cr-gpt 自己项目的 Settings->Security->Secrets and variables->Actions 切换到 Variables 选项，创建一个新变量 OPENAI_API_KEY 3 使用使用 pull request 方式，在自己的项目中 Pull request 选项卡中 create pull request，选择要合并的分支。程序会自动触发代码审查，审查信息将显示在 file changes 中。 4 注意这是一个基于 github 的应用，无需本地部署，在 github 上安 ...

Linux调试Android手机

Created2023-11-15|2_Note0_Technic3_编程Android工具

1 安装工具 1$ sudo apt-get install adb 2 开启 USB 调试 2.1 一般方法打开 " 开发者选项 "：设置界面 ->系统管理 ->关于手机 ->版本信息，多次点击“软件版本号“，直到系统提示已经启用了开发者选项。设置界面 ->系统管理 ->开发者选项勾选”开发者选项“，勾选 "USB 调试 2.2 我的手机我的手机 VIVO X50 Pro，具体操作如下：关于手机 ->版本信息 ->多次点击软件版本号设置界面 ->系统管理 ->开发者选项（无法通过搜索功能找到）打开”开发者选项“和”USB 调试“ 3 连接手机在命令行输入： 1$ sudo adb shell 在手机的弹出框中选”允许连接“ 此时至少可以访问 /sdcard 存储卡上的内容 4 注意如果使用 Linux 环境，尽量在连接时关闭 Windows 虚拟机，否则 USB 连接可能直接被映射到 Windows 系统中。打开开发模型后手机可能变慢，不使用时请酌情关闭。

模型社区_Huggingface

Created2023-11-14|2_Note0_Technic0_工具大模型

1 介绍 Hugging Face 是一个开源模型社区。目前已经共享 300k+ 模型，100k+ 应用，50k+ 数据集（截至 231114 数据），可视为 AI 界的 github。 2 官网 https://huggingface.co/ 3 主要功能 3.1 Models 模型大家都用过就不赘述了，用法和 github 差不多。 3.2 Datasets 数据集大家都用过就不赘述了。 3.3 Spaces 应用程序主要用于 Demo，可把 AI 应用部署到 Huggingface。构建 Space 方法见：Spaces Overview，请先看网页中的视频，相当简单。运行时使用 HuggingFace 的资源，少量使用时免费，大量使用时付费。默认情况下，每个 Space 环境限制为 16GB RAM、2 个 CPU 内核和 50GB（非持久）磁盘空间，可免费使用。在免费硬件上，如果未使用，空间将“进入睡眠状态”，并在一段时间后停止执行。也可以在其上购买更多资源，详见：The simplest way to access compute for AI。国内使用的时候 ...

实测_GPT_Assistant

Created2023-11-14|2_Note0_Technic0_工具大模型OpenAI

1 资源 openai 客户端源码： https://github.com/openai/openai-python/ openai 各种 API 示例： https://platform.openai.com/examples assistant 示例： https://platform.openai.com/docs/assistants/overview 2 Assistant 功能代码解释器检索功能函数调用 3 操作步骤 (较之前的 api 略复杂) 升级 openai api 1pip install --upgrade openai 创建 Assistant，定义其 instruction 并选择模型，如果需要，设置代码解释器、检索和函数调用功能。 123456assistant = client.beta.assistants.create( name="Math Tutor", instructions="You are a personal math tutor. Write and run code t ...

OPENAI的语音识别

Created2023-11-13|2_Note0_Technic2_算法1_音频

1 使用感受效果还不错，价钱也不贵，少量使用时好过自己搭环境。尽管其底层模型 whisper 是开源的，但自己搭个环境，如果不常用，还老得开着机器，也不划算。 2 使用方法 123456789from openai import OpenAIclient = OpenAI(api_key=API_KEY)audio_file= open("/opt/xieyan/share/date/231012/test5.m4a", "rb")transcript = client.audio.transcriptions.create( model="whisper-1", file=audio_file)

本地部署_ASR工具_Whisper

Created2023-11-12|2_Note0_Technic0_工具其它

1 简介 Whisper 是 OpenAI 的语音识别系统（几乎是最先进），它是免费的开源模型，可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 运行 1nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu image 大小：11.5G 运行后，即可在 9000 端口通过 swagger 调用，我先用手机录了一些简单的中文，识别效果还不错，除了第一次调用时可能是下载和加载模型时间比较长，后面再调用速度就很快。又用它识别了一个 25 分钟的 mp3（约 27M），是一位小哥哥 B 站视频对应的音频文件，识别时间约为不到 1 ...

Python判断是哪种语言

Created2023-11-12|2_Note0_Technic3_编程Python工具

12345678910111213from langdetect import detecttext = "你好，世界"#text = "坐禅はツール"text = "[のか](part0018.html#_idParaDest-31)：身体感觉是真实的吗"language = detect(text)if language == 'zh-cn': print("这是中文文本")elif language == 'ja': print("这是日文文本")else: print("这不是中文或日文", language)