Hello World
NLP学习笔记2——归一化 NLP学习笔记2——归一化
归一化因为 每一列数据的量纲不同,导致 数据分布区间存在差异。(人的身高可以是 180cm,也可以是 1.8m,这两个虽然表示意义相同,但是由于单位的不同,导致 机器学习在计算过程中也容易出现差异,所以就需要对数据进行归一化)。通过归一化,
2022-07-27
NLP学习笔记1——过拟合和欠拟合 NLP学习笔记1——过拟合和欠拟合
过拟合和欠拟合推荐博客:Understanding the Bias-Variance Tradeoff 当我们讨论预测模型时,预测误差可以分解为两个我们关心的主要子成分:由“偏差”引起的误差和由“方差”引起的误差。模型最小化偏差和方差的能
2022-07-26
Logging for Python Logging for Python
import logging logging模块简介Python的logging模块提供了通用的日志系统,可以方便第三方模块或者是应用使用。模块提供logger,handler,filter,formatter。 logger:提供日
2022-02-08
Transformer Transformer
Why Transformer?在谷歌2007年提出《Attention Is All You Need》后,基于Attention思想的Transformer模型开始越来越多地出现在大众眼中。Transformer模型基于encoder-
2022-02-08
Getting Started with SPARQL Getting Started with SPARQL
SPARQL简介SPARQL即SPARQL Protocol and RDF Query Language的缩写,专门用于访问和操作RDF数据,是语义网的核心技术之一。 从SPARQL的全称我们可以知道,其由两个部分组成:协议和查询语言。
2022-01-14
Getting Started with RDF Getting Started with RDF
资源描述框架(Resource Description Framework,RDF)是一个使用XML语法来表示的资料模型(Datamodel),用来描述Web资源的特性,及资源与资源之间的关系 。 资源描述框架为表示数据及其含义提供了一个标
2022-01-13
知识图谱学习笔记 知识图谱学习笔记
2012 年 5 月 17 日,Google 正式提出了知识图谱(Knowledge Graph)的概念,其初衷是为了优化搜索引擎返回的结果,增强用户搜索质量及体验。传统的互联网技术是基于关键字匹配,然后通过一系列的打分策略来返回搜索结果的
Mac上安装Neo4j教程 Mac上安装Neo4j教程
一般情况下,我们使用数据库查找事物间的联系的时候,只需要短程关系的查询(两层以内的关联)。当需要进行更长程的,更广范围的关系查询时,就需要图数据库的功能。 而随着社交、电商、金融、零售、物联网等行业的快速发展,现实世界的事物之间织起了一张巨
2022-01-11
正则表达式 正则表达式
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。 在线测试正则表达式网站:regex101 imp
2022-01-10
算法-二分法 算法-二分法
二分法主要是通过左右逼近的方式,向目标值靠拢,并且取得对数复杂度的算法。 下面这段代码就是一般二分法的代码,不过应该如何理解二分法的本质呢? def search(self, nums: List[int], target: int) -&
2022-01-06
NER学习整理 NER学习整理
什么是NER命名体识别(Named Entity Recognition, NER),旨在识别文本中感兴趣的实体,如位置、组织和时间。已识别的实体可以在各种下游应用程序中使用,如根据患者记录去识别和信息提取系统,也可以作为机器学习系统的特性
2021-12-31
ASR错误自动识别与纠正 ASR错误自动识别与纠正
背景随着科技的发展,越来越多种类的智能语音产品出现。虽然智能语音产品种类,但是他们依赖着有着像汽车发动机一样重要的内核——语音对话系统(Spoken dialogue systems)。一个好的语音对话系统可以帮助用户高效的解决一些问题,或
2021-12-31
2 / 3