• 最新文章

Python 分词、文本相似度分析

文本相似度分析的步骤: 1、读取文档 2、对要计算的多篇文档进行分词 3、对文档进行整理成指定格式,方便后续进行计算 4、计算出词语的词频 5、【可选】对词频低的词语进行过滤 6、建立语料库词典 7、加载要对比的文档 8、将要对比的文档通过doc2bow转化为词袋模型 9、对词袋模型进行进一步处理,得到新语料库 10、将新语料库通过tfidfmodel进行处理,得到tfidf 11、通过token

CentOS、Ubuntu、Debian三个Linux比较异同

Centos系统:生产环境上的服务器 非常多的商业公司部署在生产环境上的服务器都是使用CentOS系统,Centos是从Redhat源代码编译重新发布版,Centos去除很多与服务器功能无关的应用,系统简单但非常稳定,命令行操作可以方便管理系统和应用,并且有帮助文档和社区的支持。 Ubuntu系统:靓丽的用户界面、对计算机硬件的支持优于centos和Debian、图形界面占用内存较大 Ubuntu

Linux中修改环境变量及生效方法

方法一:   在/etc/profile文件中添加变量【对所有用户生效(永久的)】   用VI在文件/etc/profile文件中增加变量,该变量将会对Linux下所有用户有效,并且是“永久的”。   要让刚才的修改马上生效,需要执行以下代码   # source /etc/profile 方法二:   在用户目录下的.bash_profile文件中增加变量【对单一用户生效(永久的)】   用VI

SpringMVC 框架及部署方式介绍

Java语言现在应用比较多的MVC框架有SpringMVC,Struts2两种。 首先,什么是MVC? MVC其实就是一种软件的设计模式。在开发中并没有强制我们必须去遵循这种设计模式,但是遵循MVC模式会使我们系统层次更清晰;职责更明确;扩展性更强;耦合度降低。 一、SpringMVC 概述: Spring 为展现层提供的基于 MVC 设计理念的优秀的 Web 框架,是目前最主流的 MVC 框架之

WebRTC实时通信技术介绍

WebRTC (Web Real-Time Communications) 是一项实时通讯技术,它允许网络应用或者站点,在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接,实现视频流和(或)音频流或者其他任意数据的传输,其技术使用ICE协议框架。WebRTC包含的这些标准使用户在无需安装任何插件或者第三方的软件的情况下,创建点对点(Peer-to-Peer)的数据分享

公钥和私钥联系和区别

      公钥和私钥就是俗称的不对称加密方式,是从以前的对称加密(使用用户名与密码)方式的提高。我用电子邮件的方式说明一下原理。      使用公钥与私钥的目的就是实现安全的电子邮件,必须实现如下目的:      1. 我发送给你的内容必须加密,在邮件的传输过程中不能