Pytorch初探
Pytorch 初探
什么是 Pytorch
Facebook 的 Pytorch 和 Google 的 TensorFlow
一样,也是一款深度学习库,TensorFlow 主要应用于工业生产领域之中,GitHub
上的深度学习工具也多基于 TensorFlow;而 Pytorch
在研究领域被广泛使用,越来越多的论文和新技术都基于 Pytorch 开发。
工业场景比研究领域相对置后,且近年来 Pytorch
的研究论文有逐渐增加的趋势,随着前沿技术的应用,Pytorch
也可能成为一种趋势。目前常用的模型也都有对应的 Pytorch
版本,具体请见后面参考部分。
本篇就来学习一下 Pytorch。Pytorch 是 Facebook 开源的包含 GPU
加速的神经网络框架。Pytorch 是 torch 的 Python 版本,也提供 C++
的接口。
相关概念
Pytorch 不像 TensorFlow 加入了 Scope、Session
等新概念以及复杂的调用方法,有较高的学习成本,Pytorch 只有三个重要概念
Tensor(张量)、variable(变量)、Module( ...
Python声音和弹框提示
Python 声音和弹框提示
写后台监控程序,有时需要响铃或弹框提示用户。下面介绍 Python 在 Linux
系统中的提示方法:
1. 使用系统工具 paplay 播放当前目录下的音效文件 ring.wav 实现响铃
2. 用 tkinter 界面工具实现弹框
import tkinter as tk
import os
def show_messagebox(string):
os.environ["DISPLAY"]=":0.0"
root = tk.Tk()
root.title('消息框')
root.geometry('190x80+300+300')
label = tk.Label(root, text=string, font='宋体 -14', pady=8)
label.pack()
tk.mainloop()
def do_ring(times):
for i in range(0,time ...
Ubuntu下使用星际译王字典
Ubuntu 下使用星际译王字典
#操作系统/Linux
相关工具安装
123$ sudo apt-get install stardict-gtk # gtk图形化工具$ sudo apt-get install qstardict # qt图形化工具$ sudo apt-get install sdcv # 命令行工具
星际译王字典下载
http://download.huzheng.org/
分享188种英语词典·牛津词典(Txt格式)
自用词典下载
解包后安装
123$ tar xvjf stardict-xdict-ec-gb-2.4.2.tar.bz2 # 注意将bz2文件解压成目录$ sudo mkdir /usr/share/stardict/dic -p$ sudo cp stardict-xdict-ec-gb-2.4.2 /usr/share/stardict/dic/
列出词典
1$ sdcv --list-dicts
字典介绍
简明字典: xdict, 朗道
联想字典: wordnet
丰富字典: oxford
牛津英汉双解美化版:
Python量化交易之四_聚宽数据
Python 量化交易之四 _
聚宽数据
介绍
之前测试过一些免费 API,比如 tushare 现在只能下载两年半数据,163
有的股票数据无法下载,pandas_reader 速度很慢,并且只能下载 A
股的各股数据,对基金和指数支持不佳。这两天尝试了聚宽平台提供的
API,它提供的功能基本够用,总结如下。
聚宽平台提供自 2005
年至今的股票相关数据(包含各股数据、指数、基金等等),需要申请一个免费试用帐号,使用期为一年,每天可下载最多
100 万条数据(所有 A 股历史数据不到 200
万条)。一天内不能下载所有数据,用两三天时间下载所有,然后每天更新数据肯定够用,而且速度较快。
聚宽数据以 Python 三方库方式提供,一直在更新维护中,最近一次 SDK
升级时间为 2019 年 5 月。
建议读者封装数据获取模块,下载后转换成自定义数据格式,这样数据源变化了,也不影响整体软件框架。
安装
安装方法如下:
1$ pip install git+https://github.com/JoinQuant/jqdatasdk.git
(需要 python3.6 以上支持)
用法
...
Python对网页内容作词云图分析
Python
对网页内容作词云图分析
在线生成词云图
WordArt
定制性比较强,支持中文,但是图中的词需要手动输入。
https://wordart.com/
图悦
支持分析大段文字并生成词云图,但是功能相对比较简单。
http://www.picdata.cn/picdata/index.php
Python 生成词云图
本文介绍使用 Python 程序生成词云图,它依赖的三方库 wordcloud 需要编译
C++ 库,在 Windows 搭建环境比较复杂,建议在 Linux 系统中安装使用。
下例中使用了 urllib 库从抓取网页内容,jieba 库用于分词,wordcould
库用于生成词云,代码如下:
1234567891011121314151617181920212223242526272829303132333435import matplotlib.pyplot as pltimport jiebafrom wordcloud import WordCloudimport urllib.request import html2text%matplot ...
02_少儿Python编程_第二讲:开发环境
少儿 Python 编程 _
第二讲:开发环境
在开始编写程序之前,首先要搭建开发环境。Python
是一种跨平台的编程语言,它可以在 Window、Linux、MacOS
等操作系统上运行,为简化操作,本书以 Windows 系统作为开发平台,以
Anaconda 套件作为开发工具。
2.1 Python 语言
在讨论如何选择编程语言之前,先看看什么是编程。现在很多工作都离不开计算机,比如:使用各种办公软件,做图,编辑视频,开发网站,微信和手机应用,统计分析,机器人,人工智能……应该学习什么?对于非专业人员,针对青少年的知识和能力,能学什么?
希望本次学习的成果能在后续的学习和工作中发挥作用,那么就需要学习“编写真正的程序”,而不仅仅是展示某种“有趣的成果”。
图书馆里有很多十几年前的计算机工具书籍都已经不再使用,IT
行业日新月异,即使今天学习了一门最流行的编程语言,等十几年后,可能也已经过时了。
因此,最好能学习一门相对简单的编程语言,不要把时间都花在语言的细节和技巧上,Python
语言就非常合适,它可烦可简。Python 入门简单,从 8 岁到 80
岁都可以学习;同时功能强 ...
Python实现PDF转TXT
Python 实现 PDF 转 TXT
用手机或者 Kindle 看 PDF 文档字实太是太小了,总觉得 PDF 转 TXT
是个刚需,却一直没找到 PDF 转 TXT 的简单方法,最近有空,不妨自己用
Python 写一个。
将 PDF 格式转换成纯文本的
TXT,虽然会损失掉一些排版和图片,却可以给文件瘦身,也可将其中的文字用于更多场合。
PDF
里一般都包含文字和图片,有些文字以图片形式存储,比如大多数以扫描方式制作的
PDF 图书都使用这种方式,以此方式存储的 PDF
文件占空间也比较大,一般都有几十兆。另一种,以文本方式存储字符,同时存储字符的大小和位置,在显示对应的页面时绘制图片和文字,以此方式存储的
PDF 文件占空间较小,一般只有几兆大小。
分辨文字的存储方式很简单,只需要用任意支持 PDF
格式的软件打开文件,放大几倍,如果文字依然清晰,则是以字符方式存储的,如果字的边缘变得模糊,则一般是以图片方式存储文字。
以字符方式存储 PDF 的文本比较容易获取,使用 Linux 下的 pdftotxt
命令即可过滤出其中的文字。以图片方式存储的相对比较复杂, ...
Python人脸识别
Python 人脸识别
“人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用
Python 的三方模块,几行代码即可实现人脸识别。
face_recognition
是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达
99.38%。除了检测面部位置,它还能快速识别出面部特征:如眉毛、眼睛、鼻子、嘴,识别具体的人,对比两张脸的相似度等等。从后面例程可以看到,识别位置相当准确。
一、安装和原理
face_recognition 底层基于 dlib 实现。dlib
是一个人脸关键点检测库,它的核心功能由 C++
实现,适用于多个平台。不同于一般的 Python
三方模块,它在安装时需要编译,其 Github 上主要介绍了它在 Linux 和 MacOS
系统的安装方法。在 Windows 系统下编译安装过程比较复杂,需要安装 Visual
Studio 的 Visual C++ fo ...
Fritzing画电路图
Fritzing 画电路图
#Arduino
Fritzing 是一套设计 PCB (Printed Circuit Board) 印刷电路板的软件
1. Ubuntu 系统安装方法
$ sudo apt-get install fritzing
$ Fritzing # 运行
2. 其它平台软件下载地址: http://fritzing.org/download/
3. 新建元件
做图过程中难免有图库中没有的元件,需要新建元件。Fritzing
1.7
之后的版本不能直接创建元件,需要在相似元件的基础上修改,比较麻烦。我只想画一个连线示意图,操作越简单越好,故下载了
Fritzing
0.6.4b 版本,它的元件菜单中支持 " 新建 "。
最终绘图效果如下图所示:
[](https://img-blog.csdnimg.cn/20190721192642250.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpZXlhbj ...
TF-IDF逆文本频率指数
TF-IDF 逆文本频率指数
1. 原理
TF-IDF(term frequency–inverse document
frequency)是信息处理和数据挖掘的重要算法,它属于统计类方法。最常见的用法是寻找一篇文章的关键词。
其公式如下:
TF(词频)是某个词在这篇文章中出现的频率,频率越高越可能是关键字。它具体的计算方法如上面公式所示:某关键在文章中出现的次数除以该文章中所有词的个数,其中的
i 是词索引号,j 是文章的索引号,k 是文件中出现的所有词。
IDF(逆向文档频率)是这个词出现在其它文章的频率,它具体的计算方法如上式所示:其中分子是文章总数,分母是包含该关键字的文章数目,如果包含该关键字的文件数为
0,则分母为 0,为解决此问题,分母计算时常常加
1。当关键字,如“的”,在大多数文章中都出现,计算出的 idf 值算小。
词出现次数越多,idf
为越大的负数,说明这词没什么用;出现少,则为正值;不多不少为 0
把 TF 和 IDF 相乘,就是这个词在该文章中的重要程度。
2. 使用 Sklearn 提供的 TF-IDF 方法
Sklearn 是最常用的机器学习第三方 ...