avatar
Articles
878
Tags
282
Categories
185

Yan 的杂物志_个人主页分享
Search
NLTK中文词性自动标注
Created2017-03-24|2_Note0_Technic2_算法6_自然语言工具
NLTK 中文词性自动标注 #自然语言处理 1 说明 学习自然语言处理,一定会参考 NLTK,主要是学习它的思路, 从设计地角度看看能做什么. 其本质就是把语言看成字符串,字符串组,字符串集,寻找其间规律. NLTK 是多语言支持的, 但目前网上的例程几乎没有用 NLTK 处理中文的,其实可以做。比如标注功能, 它自身提供了带标注的中文语库 (繁体语料库 sinica_treebank). 下面来看看怎样通过数据训练来实现中文词性自动标注. 可以利用它来标注中本,也可以寻找和验证一些隐性的规律. 2 相关知识 2.1.1 词性标注 词汇按它们的词性 (parts-of-speech,POS) 分类以及相应的标注它们的过程, 词性包括: 名词、动词、形容词, 副词等. 2.1.2 中文字符的显示 Python 内部编码是 unicode, 所以输出中文常常像这样"ebade5", 用 print 函数输出时, 将自动转换成本地字符集, 也可以使用 encode(‘utf-8’) 函数转换. 2.1.3 数据集,训练集,评估 有监督的机器学习一般都是把数据分成两个部分, 一部分用于训练, ...
用WordNet实现中文情感分析
Created2017-03-14|2_Note0_Technic2_算法6_自然语言机器学习
用 WordNet 实现中文情感分析 #自然语言处理 1. 分析 中文的情感分析可以用词林做,词林有一大类(G类)对应心理活动,但是相对于 wordnet 还是太简单了.因此使用 nltk+wordnet 的方案,如下: 中文分词:结巴分词 中英文翻译:wordnet 汉语开放词网,可从以下网址下载: http://compling.hss.ntu.edu.sg/cow/ 情感分析:wordnet 的 sentiwordnet 组件 停用词:参考以下网页,另外加入常用标点符号 [http://blog.csdn.net/u010533386/article/details/51458591 ](http://blog.csdn.net/u010533386/article/details/51458591) 2. 代码 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970 ...
中文自然语言处理工具介绍
Created2017-03-09|2_Note0_Technic2_算法6_自然语言
中文自然语言处理工具介绍 #自然语言处理 自然语言处理是人工智能领域中的一个重要方向。它研究能人机之间通讯的方式,并涉及机器对人类知识体系的学习和应用.从分词,相似度计算,情感分析,文章摘要,到学习文献,知识推理,都涉及自然语言分析.下面介绍一些中文语言语义分析的资源.(以下只讨论能嵌入到我们程序里的资源) 1 同义词词林 《同义词词林》是 80 年代出版的一本词典,这提供了词的归类,相关性信息,起始主要用于翻译,哈工大对它进行了细化和扩充,出了《词林扩展版》,其中含有 7 万多词,17000 多种语义,五层编码.12 大类,94 中类,1428 小类,形如: 1Aa01A01= 人 士 人物 人士 人氏 人选 每一个条目对应一种语义,根据分类编号:第一位大写表示大类,第二位小写表示中类…其中涉及了一词多义和一义多词. 《词林扩展版》网上的下载很多,大小不到 1M,可以直接 load 到程序中,用于简单的分词,文章分类,模糊查找,统计,情感分析(不同感情色彩对应不同类别号)等等. 2 哈工大语言云 (LTP) 中文的语义分析工具,大多数都像 LTP 这样,提供一个在线的分析器,一组 A ...
Python入门
Created2017-02-28|2_Note0_Technic3_编程Python
Python 入门 Python 与 Java, C, C++ 并列为全球 4 大最流行语言. 从 C 到 C++,到 Java 再到 Python, 细节越来越少, 让开发者把更多的精力放在”做什么”, 而不是”怎么做”. 早就听说 Python 容易, 但没想到这么容易, 机器学习的分类器, 或是中文分词能在十行内搞定. 开始时几乎完全不用考虑具体的数据结构. 在熟悉了 Python 之后, 用它看程序逻辑就很清晰, 有点像伪代码, 让 LISP 爱好者们也如同找到了亲人. 以下是 Python 在 ubuntu 系统下的简单实例. 1. 第一个程序 Hello world 写入文件/tmp/a.py 1print('hello world') 运行 1$ python /tmp/a.py 2. 集成开发环境: Eclipse 支持 Python Eclipse 在 Help 菜单中,选择 Install New Software Add,输入 http://pydev.org/updates,按提示安装即可 3. 实例一: 机器学习 SVM 分类器 ...
01_Arduino简单实例之一_人体传感器
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 简单实例之一 _ 人体传感器 #Arduino 1) 说明 人体红外感应模块是基于红外线技术的自动控制产品。附近有人时,对应引脚高电平,反之为低平台。 5 米内有效。可用螺丝(下图中橙色部分)调节灵敏度和延时。 2) 硬件 HC-SR501 人体红外感应模块,Arduinouno,杜邦线 3) 连接 VCC 接 Arduino 3.3V GND 接 Arduino GND OUT 接 Digital 2 [](https://img- blog.csdn.net/20170220124753890?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlleWFuMDgxMQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center) 4) 代码 #define PIN_NUM 2 void setup() { Serial.begin(9600); pinMode(PIN_NUM,INPUT); } voi ...
01_Arduino综合实例之一_避障小车
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 综合实例之一 _ 避障小车 #Arduino 1. 说明: 此实例实现了通过蓝牙连接小车和手机,在手机端用软件控制小车前进,后退,左/右转向,控制行驶速度。并能让小车自动行驶,躲避障碍。 我买的是最便宜的黄色四驱小车,加了一个电机驱动模块(用于控制小车),一个蓝牙模块(用于与手机连接),一个距离传感器(测试前方是否有障碍物),一个舵机(在遇到障碍时,控制距离传感器转动,判断左/右哪边空间更大)。 2. 硬件: (加起来百十来块钱) 1) 小车硬件 小车(30+),含车架,车轮,电动机等。最便宜的一套 30 块钱左右(四驱),当然也不怎么结实。实验用没什么问题。 2) 电机驱动 电机驱动模块可使用 L298n(5+)或 L293D(8+)。一个 L298N 可驱动两个电机,一个 L293D 可驱动四个电机。我使用的是一个 L298N,控制四个电机(两两串联,也带得动)。 不太喜欢 L293D 扩展板,它是 Arduino UNO R3 的扩展板,是直接插在 Arduino 板上用的,我买的那一块,虽然能接几个舵机,几个直流电机,但是要想再插传感器就比较麻烦了,还有 TX/ ...
02_Arduino简单实例之二_光敏传感器
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 简单实例之二 _ 光敏传感器 #Arduino 1) 说明: 光敏传感器是把光信号变成电信号的一种传感器,它利用半导体的光电效应制成的一种电阻值随入射光的强弱而改变的电阻器; 入射光强,电阻减小,入射光弱,电阻增大。 可用电位器(螺丝)调节亮度阀值,亮度大于设定值时 DO 输出低电平,反之输出高电平。AO 输出具体的亮度值。建议购买四脚的(三脚的没有 AO) 2) 硬件: 光敏传感器模块,Arduinouno,杜邦线 3) 连接: VCC 接 arduino 的 3.3 或 5V GND 接 arduino 的 GND DO 接 arduino 的 Digital 2 AO 接 arduino 的 Analog 0 [](https://img- blog.csdn.net/20170220125150050?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlleWFuMDgxMQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Cente ...
03_Arduino简单实例之三_土壤湿度传感器
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 简单实例之三 _ 土壤湿度传感器 #Arduino 1) 说明: 用于土壤的湿度检测。 可通过电位器调节土壤湿度的阀值,顺时针调节,控制的湿度会越大,逆时针越小;湿度低于设定值时,DO 输出高电平,模块提示灯亮;湿度高于设定值时,DO 输出低电平,模块提示灯灭。 工作电压 3.3V-5V。3V 时,在空气中 AO 读取的值最大为 695,浸泡在水里的 最小值 245;5V 时,在空气中 AO 读取的值最大为 1023 ,浸泡在水里的最小值 245。 2) 硬件: 土壤湿度传感器,Arduinouno,杜邦线 3) 连接: VCC 接 Arduino 3.3V 或 5V GND 接 Arduino GND AO 接 ArduinoAnalog DO 接 Arduino Digital 4 [](https://img- blog.csdn.net/20170220130149517?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlleWFuMDgxMQ==/font/5a6L5L2T/fontsize/400/fill/I0 ...
04_Arduino简单实例之四_PS2游戏摇杆
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 简单实例之四 _PS2 游戏摇杆 #Arduino 1) 说明: PS2 游戏双轴摇杆传感器模块由采用金属 PS2 摇杆电位器制作,具有 (X,Y)2 轴模拟输出,(Z) 1 路按钮数字输出。可制作遥控器等互动作品。 SW 引脚按下去时输出低电平,反之输出高电平 2) 硬件: PS2 游戏摇杆 joystick,Arduino uno,杜邦线 3) 连接: 5V 接 Arduino 5V GND 接 Arduino GND URx 接 Analog 0 URy 接 Analog 1 SW 接 Digital 2 [](https://img- blog.csdn.net/20170220130702165?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlleWFuMDgxMQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center) 4) 代码 #define PIN_X 0 #define PIN_Y 1 #define ...
05_Arduino简单实例之五_红外避障传感器模块
Created2017-02-20|2_Note0_Technic3_编程Arduino
Arduino 简单实例之五 _ 红外避障传感器模块 #Arduino 1) 说明: 红外避障传感器具有一对红外线发射与接收管,发射管发射出一定频率的红外线,当检测方向遇到障碍物(反射面)时,红外线反射回来被接收管接收。它常用于安装在小车上,判断前方是否有障碍物。可通过电位器设置阀值。正前方有障碍时绿灯亮起,OUT 引脚为低电平,反之为高电平。 由于日光是也含红外线,所以大多数便宜红外模块在户外使用就会遇到问题。 2) 硬件: 红外避障模块,arduinouno,杜邦线 3) 连接:: VCC 连接: Arduino 5V(说明书上写 3.3V-5V,我的硬件只在 5V 下正常工作) GND 连接: Arduino GND OUT 连接: Digital 13 [](https://img- blog.csdn.net/20170220131517981?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlleWFuMDgxMQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/7 ...
1…737475…88
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
878
Tags
282
Categories
185
Follow Me
Announcement
This is my Blog
Recent Post
什么情况下使用强化学习2025-10-11
围棋经典算法与股票市场预测2025-10-11
强化学习工具及优化方法2025-10-11
强化学习的核心概念与实践应用2025-10-11
金融相关的强化学习工具2025-10-11
Categories
  • 0_IMO90
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听88
      • 01_自我建构36
        • 实修3
        • 思考与觉悟17
Tags
嵌入表示 Python/少儿编程 深度学习/扩散模型 markdown Python/股票 宗教 数据存储/Hadoop 数据存储/MYSQL 关系维护 父母教育 反思 理财规划 视频编辑 协议 推荐系统 SSH 生活技巧 大模型/应用 权力结构 锂 跨境支付 阅读/哲学 语言学 股票 语言模型 机器学习/算法 焦虑 决策哲学 深度学习/工具 主题笔记 语音 算法实战 深度学习/图形图像 多模态 哲学 大语言模型 美食 知识库 大型语言模型 生物医学
Archives
  • October 202515
  • September 20256
  • August 202518
  • July 202538
  • June 202537
  • May 202529
  • April 202516
  • March 20258
Info
Article :
878
Total Count :
1228.7k
UV :
PV :
Last Push :
©2020 - 2025 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database