# AI的NLP学习/embedding/tensorboard

张开发

• 2026/4/9 5:04:20 • 15 分钟阅读

分享文章

import torchimport torch.nn as nnfrom torch.utils.tensorboard import SummaryWriterimport jiebaimport osimport shutil 加载自定义词表确保人名完整分词 jieba_tokenizer jieba.Tokenizer()custom_words [“龙文浩”, “张三”, “李四”, “王五”, “工程师”, “学生”, “教师”, “医生”]for word in custom_words:jieba_tokenizer.add_word(word)构建语料词表def build_vocab():texts [“龙文浩是工程师”,“张三是学生”,“李四是教师”,“王五是医生”]words []for text in texts:words jieba_tokenizer.lcut(text)vocab sorted(list(set(words)))word2idx {w: i for i, w in enumerate(vocab)}print(“词表”, word2idx)return vocab, word2idx 构建简单 Embedding 模型 class EmbeddingModel(nn.Module):definit(self, vocab_size, embed_dim10):super().init()self.embedding nn.Embedding(vocab_size, embed_dim)def forward(self, x):return self.embedding(x) 主函数训练 TensorBoard 可视化 ifname ‘main’:vocab, word2idx build_vocab()vocab_size len(vocab)model EmbeddingModel(vocab_size, embed_dim10) word_indices torch.tensor(list(word2idx.values()), dtypetorch.long) with torch.no_grad(): embeddings model.embedding(word_indices) # 设置根目录 # 统一使用绝对路径避免相对路径歧义 log_dir os.path.abspath(rruns\embedding_visual) # 强制清空旧日志避免缓存/编码问题 if os.path.exists(log_dir): shutil.rmtree(log_dir) os.makedirs(log_dir, exist_okTrue) # 写入TensorBoard简化目录消除嵌套 writer SummaryWriter(log_dir) # 移除tag参数避免生成嵌套目录不指定global_step简化目录结构 writer.add_embedding( matembeddings, metadatavocab ) writer.close() print(\n✅ TensorBoard 文件已保存到, log_dir) print( 启动命令复制直接执行PowerShell/CMD通用) print(ftensorboard --logdir{log_dir} --host127.0.0.1 --port6006) print( 浏览器访问http://127.0.0.1:6006点击 PROJECTOR 标签查看词向量可视化)

# AI的NLP学习/embedding/tensorboard

最新文章

Sambert多情感语音合成保姆级教程：从部署到生成你的第一段语音

2.2 如何辨别“伪因子”：p-hacking、样本内过拟合与多重检验

从实验室到产线：减速机背隙检测的精度保卫战（附常见误差来源排查清单）

实战指南：星图AI云快速部署Qwen3-VL，打造企业级飞书助手

Qwen3.5-4B-Claude-Opus部署教程：GPU驱动版本兼容性与CUDA配置核查

Ollama镜像免配置部署internlm2-chat-1.8b：支持离线环境的纯本地化方案

推荐文章

网盘直链下载助手：一键解锁8大平台高速下载通道

DFRobot TFT智能屏驱动架构与LVGL协处理器实践

前端PWA吐槽：别再让你的网站像个假应用！

嵌入式系统分层架构设计与驱动框架实现

DS1307实时时钟芯片驱动开发与工程实践指南

micro-moustache：嵌入式轻量模板引擎

相关文章

Java PTA练习避坑指南：如何避免PersonOverride类中的常见错误（含完整代码示例）

DanKoe 视频笔记：成为失败者：重新定义成功与快乐 [特殊字符]

Caxa二次开发环境配置避坑指南：从ObjectCRX安装到HelloWorld运行

5分钟极速部署：Sakura启动器如何让AI翻译变得像聊天一样简单？

LuckyLilliaBot深度解析：高性能NTQQ OneBot 11协议框架架构设计与实现

OpenClaw 2026年3月史诗级迭代全景深度分析报告：从危机到新生，从工具到生态操作系统

分享文章

更多文章

OpenClaw版本升级：Qwen2.5-VL-7B兼容性测试与迁移指南

能源研究院转让哪家经验丰富

Wan2.2-I2V-A14B镜像免配置：内置模型权重42GB，节省下载与校验时间

【入门级-算法-7、搜索算法：广度优先搜索】

我们如何同步 .NET 的虚拟单体仓库（二）账

WPS加载项实战：从零构建AI办公助手

SDMatte Web服务日志分析：常见错误码含义、超时原因定位、修复建议

MIT AI工具一分钟预览高度逼真3D打印成品外观，所见即所得

OpenClaw+Qwen3-14B代码补全：VS插件开发与私有模型接入

OpenClaw性能调优：Qwen3-32B在RTX4090D上的参数最佳实践

自动化审计流水线：OpenClaw串联SecGPT-14B与Wazuh日志

智慧农业草莓成熟度识别基于cnn的YOLOv11深度学习智慧农业草莓成熟度目标检测系统草莓识别系统(数据集使用 YOLOv11 进行草莓成熟度计数与检测注意：此模块是在以下资源的+模型+界面)