算法和数据结构复习
养成自顶向下的编程习惯,参考,类似写报纸新闻一样,主要逻辑放在最上面(新闻标题 ——> 主函数),后面再写具体的细节(正文 ——> 具体的功能子函数)
时间复杂度和空间复杂度:这部分看到具体的代码能够说出来即可(找主要语句的执行次数)
面试时要和面试官把题目的意思和边界条件明确(不要害怕沟通),尽可能想出自己能力范围内的所有解法,然后比较他们之间的时间和空间复杂度,最后写出的最优的解决方案。
养成自顶向下的编程习惯,参考,类似写报纸新闻一样,主要逻辑放在最上面(新闻标题 ——> 主函数),后面再写具体的细节(正文 ——> 具体的功能子函数)
时间复杂度和空间复杂度:这部分看到具体的代码能够说出来即可(找主要语句的执行次数)
面试时要和面试官把题目的意思和边界条件明确(不要害怕沟通),尽可能想出自己能力范围内的所有解法,然后比较他们之间的时间和空间复杂度,最后写出的最优的解决方案。
如果需要判断句子与句子之间的相似度,仅使用上述的词向量方法显然是不行的,所以如何获得句向量也是十分重要。句向量代表了整句话的语义信息,可以帮助机器理解上下文,意图及其它重要信息。
获得句向量的方法可以归为加权平均法和模型法两大类,下面分别给出这两大类中的具体方法:
1 | class Solution: |
在NLP领域的任务中,为了使模型便于训练,需要将词语或文本表征为固定长度的数值特征向量,最开始使用的便是词袋表征方法(BOW),类似于one-hot编码,区别在于向量中的每个元素是相应单词在文本中出现的统计次数。但是这种方法无法区别下述情况:
This is the first document.
Is this the first document?