喀什住房和城乡建设局网站正规接单赚佣金的app

当前位置: 首页 > news >正文

喀什住房和城乡建设局网站,正规接单赚佣金的app,注册外贸公司需要多少钱,网站建站公司服务好吗自然语言处理作业1–双向匹配算法 一、概述 双向匹配算法是一种用于自然语言处理的算法#xff0c;用于确定两个文本之间的相似度或匹配程度。该算法通常使用在文本对齐、翻译、语义匹配等任务中。 在双向匹配算法中#xff0c;首先将两个文本分别进行处理#xff0c;然后…自然语言处理作业1–双向匹配算法 一、概述 双向匹配算法是一种用于自然语言处理的算法用于确定两个文本之间的相似度或匹配程度。该算法通常使用在文本对齐、翻译、语义匹配等任务中。 在双向匹配算法中首先将两个文本分别进行处理然后分别从两个文本的角度进行匹配。这种双向匹配可以更全面地考虑两个文本之间的相似性避免单向匹配算法可能出现的遗漏或错误匹配的情况。 双向匹配算法通常包括以下步骤 分词处理对两个文本分别进行分词处理将文本分割成词语或短语的序列。特征提取从两个文本中提取特征如词频、词性、语义信息等。匹配计算使用不同的匹配算法如余弦相似度、编辑距离等计算两个文本之间的相似度或匹配程度。结果合并将两个文本的匹配结果进行合并得到最终的匹配结果。 双向匹配算法能够更准确地捕捉两个文本之间的相似性提高了文本对齐、翻译、语义匹配等任务的准确性和效率。因此在自然语言处理领域中得到了广泛的应用。 二、算法描述 正向最大匹配算法是一种中文分词算法用于将连续的中文文本切分成词语。步骤如下 从切分列表的第一个位置开始取出长为最大词长MaxLen的词语作为子串。判断子串是否在词库中存在若存在则将该词作为分词结果并将切分列表中对应的部分删除。若子串在词库中不存在则将子串的最后一个字符去掉得到一个新的子串。重复步骤2和步骤3直到子串为空或切分列表为空。返回分词结果。 反向最大算法也是一种中文分词算法与正向最大匹配算法相反从待分词文本的末尾开始逆向切分成词语。步骤如下 从切分列表最后一个位置开始取出长为最大词长MaxLen的词语作为子串。判断子串是否在词库中存在若存在则将该词作为分词结果并将切分列表中对应的部分删除。若子串在词库中不存在则将子串的第一个字符去掉得到一个新的子串。重复步骤2和步骤3直到子串为空或切分列表为空。返回分词结果。 逆向最大匹配算法与正向最大匹配算法的区别在于匹配的方向逆向最大匹配算法从后往前匹配词语但原理和步骤与正向最大匹配算法相似。 三、详细描述 以“对外经济技术合作与交流不断扩大。”为例详细描述算法如下 正向最大匹配算法 假设最大词长MaxLen为5 取子串 “对外经济技”扫描词典没有匹配子串长度减1变为“对外经济”“对外经济”扫描词典没有匹配子串长度减1变为“对外经”“对外经”扫描词典没有匹配子串长度减1变为“对外”“对外” 扫描词典有匹配输出“对外”输入变为“经济技术合”“经济技术合”扫描词典没有匹配子串长度减1变为“经济技术”“经济技术合”扫描词典没有匹配子串长度减1变为“经济技术”“经济技”扫描词典没有匹配子串长度减1变为“经济”“经济”扫描词典有匹配输出“经济”输入变为“技术合作与”“技术合作与”扫描词典没有匹配子串长度减 1 变为“技术合作”“技术合作”扫描词典没有匹配子串长度减 1 变为“技术合”“技术合”扫描词典没有匹配子串长度减 1 变为“技术”“技术”扫描词典有匹配输出“技术”输入变为“合作与交流”“合作与交流”扫描词典没有匹配子串长度减 1 变为“合作与交”“合作与交”扫描词典没有匹配子串长度减 1 变为“合作与”“合作与”扫描词典没有匹配子串长度减 1 变为“合作”“合作”扫描词典有匹配输出“合作”输入变为“与交流不断”“与交流不断”扫描词典没有匹配子串长度减 1 变为“与交流不”“与交流不”扫描词典没有匹配子串长度减 1 变为“与交流”“与交流”扫描词典没有匹配子串长度减 1 变为“与交”“与交”扫描词典没有匹配子串长度减 1 变为“与”“与”扫描词典有匹配输出“与”输入变为“交流不断扩”“交流不断扩”扫描词典没有匹配子串长度减 1 变为“交流不断”“交流不断”扫描词典没有匹配子串长度减 1 变为“交流不”“交流不”扫描词典没有匹配子串长度减 1 变为“交流”“交流”扫描词典有匹配输出“交流”输入变为“不断扩大。”“不断扩大。”扫描词典没有匹配子串长度减 1 变为“不断扩大”“不断扩大”扫描词典没有匹配子串长度减 1 变为“不断扩”“不断扩”扫描词典没有匹配子串长度减 1 变为“不断”“不断”扫描词典有匹配输出“不断”输入变为“扩大。”“扩大。”扫描词典没有匹配子串长度减 1 变为“扩大”“扩大”扫描词典有匹配输出“扩大” 输入变为“。”“。”扫描词典有匹配输入变为“”扫描终止 正向最大匹配法最终的切分结果为“对外/经济/技术/合作/与/交流/不断/扩大/。” 反向最大匹配算法 假设最大词长MaxLen为5 取子串 “不断扩大。”扫描词典没有匹配子串长度减1变为“不断扩大”“断扩大。”扫描词典没有匹配子串长度减1变为“扩大。”“扩大。”扫描词典没有匹配子串长度减1变为“大。”“大。”扫描词典没有匹配子串长度减1变为“。”“。”扫描词典有匹配输出“。”输入变为“流不断扩大”“流不断扩大”扫描词典没有匹配子串长度减1变为“不断扩大”“不断扩大”扫描词典没有匹配子串长度减1变为“断扩大”“断扩大”扫描词典没有匹配子串长度减1变为“扩大”“扩大”扫描词典有匹配输出“扩大”输入变为“与交流不断”“与交流不断”扫描词典没有匹配子串长度减1变为“交流不断”“交流不断”扫描词典没有匹配子串长度减1变为“流不断”“流不断”扫描词典没有匹配子串长度减1变为“不断”“不断”扫描词典有匹配输出“不断”输入变为“合作与交流”“合作与交流”扫描词典没有匹配子串长度减1变为“作与交流”“作与交流”扫描词典没有匹配子串长度减1变为“与交流”“与交流”扫描词典没有匹配子串长度减1变为“交流”“交流”扫描词典有匹配输出“交流”输入变为“技术合作与”“技术合作与”扫描词典没有匹配子串长度减1变为“术合作与”“术合作与”扫描词典没有匹配子串长度减1变为“合作与”“合作与”扫描词典没有匹配子串长度减1变为“作与”“作与”扫描词典没有匹配子串长度减1变为“与”“与”扫描词典有匹配输出“与”输入变为“济技术合作”“济技术合作”扫描词典没有匹配子串长度减1变为“技术合作”“技术合作”扫描词典没有匹配子串长度减1变为“术合作”“术合作”扫描词典没有匹配子串长度减1变为“合作”“合作”扫描词典有匹配输出“合作”输入变为“外经济技术”“外经济技术”扫描词典没有匹配子串长度减1变为“经济技术”“经济技术”扫描词典没有匹配子串长度减1变为“济技术”“济技术”扫描词典没有匹配子串长度减1变为“技术”“技术”扫描词典有匹配输出“技术”输入变为“对外经济”“对外经济”扫描词典没有匹配子串长度减1变为“外经济”“外经济”扫描词典没有匹配子串长度减1变为“经济”“经济”扫描词典有匹配输出“经济”输入变为“对外”“对外”扫描词典有匹配输出“对外”输入变为“”扫描终止 反向最大匹配法最终的切分结果为“对外/经济/技术/合作/与/交流/不断/扩大/。” 四、软件演示