Andrej Karpathy 的 Neural Networks: Zero to Hero 系列视频笔记:2 - Makemore
原视频: The spelled-out intro to language modeling: building makemore 注意,可以透过将代码复制到 colab 或 jupyter notebook 运行, 部分生图的输出结果本文贴图效果不佳,所以建议亲自动手跟着视频操作理解。本文的笔记仅作参考。 目标 Makemore 接收一个文本文件(例如提供的 names.txt),其中每一行都假定为一个训练“对象”。 然后,它生成更多类似的东西。 在内部,Makemore 是一个字符级语言模型。每一行都包含一个示例,即模型中的一系列单个字符。 这是Makemore操作的层面,试图预测序列/单词中的下一个字符。 Makemore 是一个以现代方式实现的字符级语言建模工具。 我们的目标是从零开始构建Makemore,并理解其工作原理。 import torch import torch.nn.functional as F import matplotlib.pyplot as plt %matplotlib inline device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") # Use GPU if available (faster calculations with PyTorch) words = open('names.txt', 'r').read().splitlines() #Python list of strings print("First 10 names: ", words[:10]) # First ten names, each as separate string print("Dataset size: ", len(words)) # Amount of words in dataset print("Shortest name: ", min(len(w) for w in words)) # Smallest word in dataset print("Longest name: ", max(len(w) for w in words)) # Longest word in dataset First 10 names: ['emma', 'olivia', 'ava', 'isabella', 'sophia', 'charlotte', 'mia', 'amelia', 'harper', 'evelyn'] Dataset size: 32033 Shortest name: 2 Longest name: 15 采用字符级方法,每个单词实际上是一组打包的示例,这些示例说明了哪个字符跟在哪个字符后面 / 哪个字符先出现 / 字符序列中大概有多少字符。...