浅谈PHPANALYSIS提取关键字


Posted in PHP onMarch 08, 2019

最近在开发一个文章模块功能,设计那边提出要给文章生成对应标签,用于文章关联推送,这里和大家分享一下实现过程;

这里需要用到PHPAnalysis,下载链接如下

提取关键字方法如下:

<?php
/** 
 * 关键字提取方法 
 * 
 * @param $title string 
 *  进行分词的标题 
 * @param $content string 
 *  进行分词的内容 
 * @return array 得到的关键词数组 
 */ 

function getKeywords($title = "", $content = "") { 
 if (empty ( $title )) { 
 return array (); 
 } 
 if (empty ( $content )) { 
 return array (); 
 } 
 $data = $title . $title . $title . $content; // 为了增加title的权重,这里连接3次 
 
 //这个地方写上phpanalysis对应放置路径 
 require_once './phpanalysis/phpanalysis.class.php'; 
 
 PhpAnalysis::$loadInit = false; //初始化类时是否直接加载词典,选是载入速度较慢,但解析较快;选否载入较快,但解析较慢
 $pa = new PhpAnalysis ( 'utf-8', 'utf-8', false ); 

 $pa->LoadDict (); //载入词典
 $pa->SetSource ( $data ); //设置源字符串
 $pa->StartAnalysis ( true ); //是否对结果进行优化
 
 $tags = $pa->GetFinallyKeywords (4); // 获取文章中的五个关键字 
 
 $tagsArr = explode (",",$tags); 
 return $tagsArr;//返回关键字数组 
}

下面模拟一组数据验证一下其可行性和准确度;

$title = "最前线丨科技股领跌美股大盘,是否预示着下一轮的经济风暴?";
$content = " 科技股加速下跌,“危机”或许刚刚开始。

周三,美国股市遭遇重挫,纳指收盘大跌逾4%,道指跌超800点。截止收盘,纳斯达克指数大跌4.08%,报7422.05点,创7月3日以来最低,标普500指数下跌3.29%,创2月以来最大跌幅,道琼斯指数下跌3.15%,报25598.74点,创8月16日以来最低。

美股年内表现最好的科技股也普遍跳水,亚马逊跌超6%,单日市值蒸发超500亿美元,苹果、谷歌、Facebook均跌逾4%,奈飞跌超8%。中概股也未能幸免,京东、百度均跌超3%,流利说收跌14.99%,拼多多收跌9%,阿里巴巴收跌5.89%,在最近5个交易日中,阿里巴巴累计跌掉了15%,已经创下2014年纽约上市以来最大5天跌幅。

这轮暴跌早有信号,此前三天内,美股“恐慌指数”VIX大幅增长至58%,隔夜大涨近28%。一般而言,股市上涨时VIX指数倾向于下跌。而市场利空消息或许是美股隔夜巨震的重要原因。

9月26日美联储货币政策公布,决定今年第三次加息25个基点。美联储主席鲍威尔一周内两度公开表态渐进式加息,他认为美国经济表现“相当正面”,没有理由不认为当前的经济扩张“可以延续相当一段时间”。

一边是美联储坚定的加息立场,一边是特朗普的连番指责。周三美股收盘后,特朗普指责美联储“已经疯了”,表示不同意联储现在的行动,等待矫正,并期待已久。

本月9日,国际货币基金组织(IMF)发布最新一期《世界经济展望》报告,下调今明两年世界经济增速至3.7%,这低于7月预测的3.9%。IMF还将2019年美国经济预期增长率由2.7%下调至2.5%,原因之一是美国加征关税措施正在逐步落实,导致全球的贸易摩擦不断升级,《报告》就此发出警告并呼吁各经济体系共同努力,维护世界经济增长。

这一系列的举措和警示已经落实在美国股市,美股在周三大跌之前已经出现疲软,进入9月就有微跌,这次的大跌让美股短期内不被看好板上钉钉。而对于科技股首当其冲领跌大盘的原因,还得结合市场环境和企业自身来看。

今年以来科技巨头在美股市场表现强劲,Netflix涨幅达70%左右,亚马逊股价累计上涨50%,苹果也攀升了近30%。“科技股在2018年迄今已获得巨大涨幅,这意味着其价格有点稍贵,因此很自然会出现回调。此外,科技股都是些面临大量国际风险敞口的跨国公司股票。他们的很大一部分利润来自海外市场,很容易受到国际贸易形势的影响。”E-Trade Financial公司高级副总裁Chris Larkin在上个月就做出预测。

而连日来,部分科技股各自也是烦恼不断,苹果iPhone XS销量不如预期,谷歌母公司盈利不佳,亚马逊将员工最低时薪提升至15美元,塞德勒给客户的研报中称这一举动会给亚马逊第四季度新增3.1亿美元的成本。

股价回调、国际贸易摩擦、企业发展现状及战略等因素致使科技股被同步抛售。以目前美股释放出的信号来看,科技股在大跌中进入了回调期,自然免不了要经历一段暗黑时光,陪跑的还有全球股市。

从数据来看,欧洲三大股指已经集体大跌,英国富时100指数收跌1.27%,法国CAC40指数跌2.11%,德国DAX指数跌2.21%。亚太市场受到强力波及,今日开盘均大跌,日经225指数跌3.1%,跌破22800关口,韩国首尔综指开盘跌2.35%,A股市场大幅低开,沪指盘中跌破“熔断底”,香港恒生指数低开3.1%,下破26000点,创15个月新低。

苏宁金融研究院特约研究员江瀚表示,美国的十年大牛市可能已经处于强弩之末,在这样的情况下,一旦美国股市出现大规模问题,必然会引发其他地区股市的病毒式爆发,这将会引发全球市场的担忧。";
echo "<pre>";
var_dump(getKeywords($title,$content));die;

上面内容提取出来的五个关键字如下:

以上所述是小编给大家介绍的PHPANALYSIS如何提取关键字详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

PHP 相关文章推荐
用PHP实现图象锐化代码
Jun 14 PHP
php mssql 时间格式问题
Jan 13 PHP
PHP 截取字符串函数整理(支持gb2312和utf-8)
Feb 16 PHP
php smarty 二级分类代码和模版循环例子
Jun 16 PHP
php数据结构 算法(PHP描述) 简单选择排序 simple selection sort
Aug 09 PHP
php批量上传的实现代码
Jun 09 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(九)
Jun 24 PHP
php实现异步数据调用的方法
Dec 24 PHP
PHP类的声明与实例化及构造方法与析构方法详解
Jan 26 PHP
简要剖析PHP的Yii框架的组件化机制的基本知识
Mar 17 PHP
PHP中使用OpenSSL生成证书及加密解密
Feb 05 PHP
PHP中遍历数组的三种常用方法实例分析
Jun 24 PHP
PHP levenshtein()函数用法讲解
Mar 08 #PHP
PHP implode()函数用法讲解
Mar 08 #PHP
浅谈php使用curl模拟多线程发送请求
Mar 08 #PHP
PHP htmlspecialchars()函数用法与实例讲解
Mar 08 #PHP
浅谈PHP进程管理
Mar 08 #PHP
PHP多进程通信-消息队列使用
Mar 08 #PHP
浅谈PHP匿名函数和闭包
Mar 08 #PHP
You might like
允许phpmyadmin空密码登录的配置方法
2011/05/29 PHP
javascript 清空form表单中某种元素的值
2009/12/26 Javascript
推荐40个简单的 jQuery 导航插件和教程(下篇)
2012/09/14 Javascript
前后台交互过程中json格式如何解析以及如何生成
2012/12/26 Javascript
Javascript高级技巧分享
2014/02/25 Javascript
jquery查找tr td 示例模拟
2014/05/08 Javascript
jQuery提示插件alertify使用指南
2015/04/21 Javascript
javascript中setTimeout使用指南
2015/07/26 Javascript
深入php面向对象、模式与实践
2016/02/16 Javascript
js判断图片加载完成后获取图片实际宽高的方法
2016/02/25 Javascript
详解JavaScript对象类型
2016/06/16 Javascript
jQuery 3.0十大新特性最终版发布
2016/07/14 Javascript
javascript实现获取图片大小及图片等比缩放的方法
2016/11/24 Javascript
vue.js如何将echarts封装为组件一键使用详解
2017/10/10 Javascript
详解vuex结合localstorage动态监听storage的变化
2018/05/03 Javascript
解决Mac安装thrift因bison报错的问题
2018/05/17 Javascript
详解Vue取消eslint语法限制
2018/08/04 Javascript
原生JavaScript之es6中Class的用法分析
2020/02/23 Javascript
[22:20]初生之犊-TI4第5名LGD战队纪录片
2014/08/13 DOTA
Django1.7+python 2.78+pycharm配置mysql数据库
2016/10/09 Python
Python实现扩展内置类型的方法分析
2017/10/16 Python
Python实现的多叉树寻找最短路径算法示例
2018/07/30 Python
python如何实现不用装饰器实现登陆器小程序
2019/12/14 Python
django ORM之values和annotate使用详解
2020/05/19 Python
没编程基础可以学python吗
2020/06/17 Python
python操作ini类型配置文件的实例教程
2020/10/30 Python
耐克巴西官方网站:Nike巴西
2016/08/14 全球购物
简单叙述一下MYSQL的优化
2016/05/09 面试题
信息工程学院毕业生推荐信
2013/11/05 职场文书
家长会欢迎标语
2014/06/24 职场文书
个人租房协议书样本
2014/10/01 职场文书
病危通知书样本
2015/04/17 职场文书
优秀家长事迹材料(2016推荐版)
2016/02/29 职场文书
golang中的空slice案例
2021/04/27 Golang
MySQL中InnoDB存储引擎的锁的基本使用教程
2021/05/26 MySQL
python三子棋游戏
2022/05/04 Python