avatar
Articles
878
Tags
282
Categories
185

Yan 的杂物志_个人主页分享
Search
实测_GPT_Assistant
Created2023-11-14|2_Note0_Technic0_工具大模型OpenAI
1 资源 openai 客户端源码: https://github.com/openai/openai-python/ openai 各种 API 示例: https://platform.openai.com/examples assistant 示例: https://platform.openai.com/docs/assistants/overview 2 Assistant 功能 代码解释器 检索功能 函数调用 3 操作步骤 (较之前的 api 略复杂) 升级 openai api 1pip install --upgrade openai 创建 Assistant,定义其 instruction 并选择模型,如果需要,设置代码解释器、检索和函数调用功能。 123456assistant = client.beta.assistants.create( name="Math Tutor", instructions="You are a personal math tutor. Write and run code t ...
OPENAI的语音识别
Created2023-11-13|2_Note0_Technic2_算法1_音频
1 使用感受 效果还不错,价钱也不贵,少量使用时好过自己搭环境。 尽管其底层模型 whisper 是开源的,但自己搭个环境,如果不常用,还老得开着机器,也不划算。 2 使用方法 123456789from openai import OpenAIclient = OpenAI(api_key=API_KEY)audio_file= open("/opt/xieyan/share/date/231012/test5.m4a", "rb")transcript = client.audio.transcriptions.create( model="whisper-1", file=audio_file)
本地部署_ASR工具_Whisper
Created2023-11-12|2_Note0_Technic0_工具其它
1 简介 Whisper 是 OpenAI 的语音识别系统(几乎是最先进),它是免费的开源模型,可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 运行 1nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu image 大小:11.5G 运行后,即可在 9000 端口通过 swagger 调用,我先用手机录了一些简单的中文,识别效果还不错,除了第一次调用时可能是下载和加载模型时间比较长,后面再调用速度就很快。 又用它识别了一个 25 分钟的 mp3(约 27M),是一位小哥哥 B 站视频对应的音频文件,识别时间约为不到 1 ...
Python判断是哪种语言
Created2023-11-12|2_Note0_Technic3_编程Python工具
12345678910111213from langdetect import detecttext = "你好,世界"#text = "坐禅はツール"text = "[のか](part0018.html#_idParaDest-31):身体感觉是真实的吗"language = detect(text)if language == 'zh-cn': print("这是中文文本")elif language == 'ja': print("这是日文文本")else: print("这不是中文或日文", language)
OPENAI 开发者大会_观后感_231107
Created2023-11-07|2_Note0_Technic6_思考
GPT4 Turbo 功能 Token 更长 3.2W->12.8W 个 token 很好,但影响不是很大,一次传那么多也很贵 JSON 响应,对程序更友好 GPT3.5 的 JSON 已明显好于其它模型,更进一步 检索功能 + 分析资料 +2023.4 月知识库 之前这些功能由外围提供,纳入外围 多模态集成 之前大家自行实现,降维打击,构建生态 GPT-4 fine-tuning 不知道能做成什么样?如何收费? 速度 x2, 版权问题,定价 1/3(真材实料) 输入 token 价格 0.01 美元 / 1000 token 输出 token 价格 0.03 美元 / 1000 token 开发 与周边产品结合:执行程序 Agent & 定制 GPT 应用,demo 一些应用场景 更丰富的 API,集成了之前的外围功能,可以和函数交互,和文档交互,历史记录 新的交互的方式,像一个身边的助手,除了问答,还可以作为 agent 执行操作,接入应用 一些思考 看了两遍,第一遍挺震惊的;冷静下来又细看了一下 作为 OPENAI,做到 GPT-4 ...
Web服务_Nginx
Created2023-10-31|2_Note0_Technic3_编程前端
1 Nginx Nginx(发音为 "engine x")是一个高效的开源 HTTP 服务器和反向代理服务器。作为 HTTP 服务器,Nginx 的功能类似于 Apache,它可以将静态网站内容提供为 HTTP 服务,即创建网站。 反向代理的概念可能不太容易理解,让我们通过两个典型的场景来解释一下: 在客户的场地内,我们可能需要启动多个端口的 Web 服务,但客户只允许我们打开两个端口。 我的博客和公众号服务都需要在 80 端口上运行,但它们是两个完全不同的程序,不方便合并代码。 在这种情况下,我们可以使用 Nginx 作为中间的转发。例如,我们可以将所有以 /wx 为相对路径的请求都转发到运行在 8082 端口的公众号服务上,其余的请求则被视为博客请求,转发到运行在 8083 端口的博客服务进行处理。 2 使用 Docker 运行 Http 服务 作为 Http 服务使用时,推荐以下方法: 2.1 安装 docker 镜像 1$ docker pull nginx docker image 很小,仅需要 187 M 2.2 启动 nginx 服务 1$ docker run -- ...
代码规则化工具 Black Formatter
Created2023-10-29|2_Note0_Technic0_工具编程工具
1 说明 用途:规范化代码格式 2 VSCode 在 VSCode 中安装 Black Formatter 插件 打开.py 文件,在文件空白处右击,选择格式化文档,该文档自动完善格式。 注意 VSCode 有自己的格式化工具,所以用 VSCode 写的代码格式都还行,主要处理其它不太规范的化码 不支持 ipynb 文件 3 命令行 pip install black black xx.py 4 说明 我个人更喜欢命令行方式
Python在pdf中提取表格
Created2023-10-29|2_Note0_Technic3_编程Python工具
1 Tabula-py 1.1 开源项目 https://github.com/chezou/tabula-py 1.9k star 1.2 安装 1pip install tabula-py 1.3 使用 12import tabuladfs = tabula.read_pdf(pdf_path, stream=True) 1.4 评测 它使用到 java 库,会使开发环境变得比较重 2 camelot 2.1 开源项目 https://github.com/atlanhq/camelot 3.5k star https://github.com/camelot-dev/camelot 2.4k star 2.2 安装 1pip install camelot-py 2.3 评测 需要安装 opencv,opengl,安装起来比较麻烦,比较重。 3 pdfplumber 3.1 开源项目 https://github.com/jsvine/pdfplumber 4.7k star 3.2 安装 1pip install pdfplumber 3.3 评测 这是一个 pdf 解析库,不 ...
Python行对齐工具difflib
Created2023-10-29|2_Note0_Technic3_编程Python工具
1 用途 1.1 功能 对比两个字符串数组之间的差异,以第一个参数为基准,与第二个参数比较。 1.2 使用场景 一个原文件,一个改过的文件,对比差异; 一个纯文本,一个带格式的,对比差异; 比较不同方法生成的文本的差异。 1.3 使用体验 实现的功能类似于 Linux 中的 diff 命令;内容少看不出来好,内容一多,效果明显。这功能手写得疯了。 2 使用方法 2.1 示例 1234567891011121314151617import difflibdef compare_and_align(text1, text2): # 创建 Differ 对象 d = difflib.Differ() # 使用 Differ 对象比较文本 for x in d.compare(text1, text2): print(x) print('----')# 两个文本示例text1 = ["This is a sample text for alignment.","a"," ...
买域名
Created2023-10-19|2_Note0_Technic4_系统网络
最近 ip 快把我弄疯了,然后买了个域名,一个来小时就能用了。 原因 做自己软件的后台服务 给客户做演示 做自己主页,以及被搜索引擎收录 使用 vpn 隧道 / 内网穿透,需要设置地址 科学上网需要设置中转服务地址 ip 地址记不住 租了多个云服务器,想统一入口 需要固定的地址,而云服务器重启后 ip 有变化 问题及解决 价格 一年几十块钱,新用户第一年比较便宜(一顿普通的午饭钱) 需要多长时间 比如在某度买,需要实名认证(认证成功发短信),人工认证需要几个小时 设置域名解析,一般 30 分钟内生效,最常不会超过 24 小时 我有多个云服务器,如何使用同一个域名 服务商可提供把不同功能指向不同服务器,比 www.aaa.com 指向一个服务器,test.aaa.com 指向另一个,可在规则中设置。 也可在其中主要服务器上做端口映射 是否需要备案 如果服务器在国内且做自己的网站(有网页或 Http 服务),则需要备案,详见 备案
1…333435…88
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
878
Tags
282
Categories
185
Follow Me
Announcement
This is my Blog
Recent Post
什么情况下使用强化学习2025-10-11
围棋经典算法与股票市场预测2025-10-11
强化学习工具及优化方法2025-10-11
强化学习的核心概念与实践应用2025-10-11
金融相关的强化学习工具2025-10-11
Categories
  • 0_IMO90
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听88
      • 01_自我建构36
        • 实修3
        • 思考与觉悟17
Tags
自我表达 工具 方法论 编程语言/JNI 算法实战 语音 网络环境 AI绘画 LLM 笔记/Obsidian 抑郁 强化学习 生活技巧 思维整理 行为模式 远视镜 markdown 图形图像 个人信息 辅助编程 数据库 Android/theme 投资 数据安全 Django 远程桌面 社会学 编程 决策哲学 父母教育 算法 心情 机器学习/自动建模 #Python 公司分析 日常琐事 Python/数据 灵感创意 感知 目标管理
Archives
  • October 202515
  • September 20256
  • August 202518
  • July 202538
  • June 202537
  • May 202529
  • April 202516
  • March 20258
Info
Article :
878
Total Count :
1228.7k
UV :
PV :
Last Push :
©2020 - 2025 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database