0%

养成自顶向下的编程习惯,参考,类似写报纸新闻一样,主要逻辑放在最上面(新闻标题 ——> 主函数),后面再写具体的细节(正文 ——> 具体的功能子函数)

时间复杂度和空间复杂度:这部分看到具体的代码能够说出来即可(找主要语句的执行次数)

面试时要和面试官把题目的意思和边界条件明确(不要害怕沟通),尽可能想出自己能力范围内的所有解法,然后比较他们之间的时间和空间复杂度,最后写出的最优的解决方案。

阅读全文 »

Sentence Embedding

如果需要判断句子与句子之间的相似度,仅使用上述的词向量方法显然是不行的,所以如何获得句向量也是十分重要。句向量代表了整句话的语义信息,可以帮助机器理解上下文,意图及其它重要信息。

获得句向量的方法可以归为加权平均法模型法两大类,下面分别给出这两大类中的具体方法:

阅读全文 »

2021.4.8 星期四 阴天/冷
上午 Bert论文阅读
下午 Bert源码阅读
晚上 排序算法学习
阅读全文 »

70. 爬楼梯 (2021.3.15)

1. 递归法/动态规划

1
2
3
4
5
6
class Solution:
@lru_cache
def climbStairs(self, n: int) -> int:

if n <= 2: return n
return self.climbStairs(n-2) + self.climbStairs(n-1)
阅读全文 »

2021.3.12

1. Layer Normalization 和 batch Normalization的区别?

2. 确认transformer残差单元的输入和输出维度是否相同,以及“encoder-decoder attention”层具体的操作?

阅读全文 »

贪心算法

  • 贪心:当下做局部最优判断
  • 回溯:能够回退
  • 动态规划:最优判度 + 回退
    阅读全文 »

前言

在NLP领域的任务中,为了使模型便于训练,需要将词语或文本表征为固定长度的数值特征向量,最开始使用的便是词袋表征方法(BOW),类似于one-hot编码,区别在于向量中的每个元素是相应单词在文本中出现的统计次数。但是这种方法无法区别下述情况:

This is the first document.
Is this the first document?

阅读全文 »

这是Migo的博客 :)

学习还是应该要有所输出的,不然没法加深理解和记忆,这个博客就当是自己学习知识和记录生活的备份吧。

希望自己可以一直坚持下去!!!