用Python实战破解维吉尼亚密码：从频率分析到密钥还原（附完整代码）

张开发

• 2026/6/5 21:34:36 • 15 分钟阅读

分享文章

用Python实战破解维吉尼亚密码从频率分析到密钥还原附完整代码维吉尼亚密码作为古典密码学的经典代表曾被认为是不可破解的加密方案。直到19世纪查尔斯·巴贝奇和弗里德里希·卡西斯基先后提出系统性的破解方法才彻底打破了这个神话。本文将带你用现代Python技术重现这场密码学史上的重大突破从字母频率可视化到自动化密钥还原完整实现维吉尼亚密码的破解流程。1. 环境准备与基础工具在开始破解之前我们需要准备几个关键工具。首先是英文字母频率统计表——这是所有频率分析的基础。与直接使用现成的统计表不同我们先用Python生成自己的参考数据from collections import Counter import matplotlib.pyplot as plt def generate_frequency_reference(text): 生成英文字母频率参考表 letters [c.lower() for c in text if c.isalpha()] total len(letters) freq Counter(letters) return {char: count/total for char, count in freq.items()} # 使用莎士比亚作品作为语料库 with open(shakespeare.txt) as f: reference_freq generate_frequency_reference(f.read()) # 可视化频率分布 plt.bar(reference_freq.keys(), reference_freq.values()) plt.title(English Letter Frequency Distribution) plt.xlabel(Letter) plt.ylabel(Frequency) plt.show()这段代码会生成标准的英语字母频率分布图其中e、t、a等字母会明显高于其他字母。值得注意的是不同语料库可能产生细微差异但整体分布模式保持一致。接下来实现维吉尼亚密码的解密函数def vigenere_decrypt(ciphertext, key): 维吉尼亚密码解密函数 plaintext [] key_len len(key) for i, char in enumerate(ciphertext): if char.isalpha(): shift ord(key[i % key_len].lower()) - ord(a) decrypted chr((ord(char.lower()) - ord(a) - shift) % 26 ord(a)) plaintext.append(decrypted) else: plaintext.append(char) return .join(plaintext)2. 密钥长度检测技术2.1 Kasiski测试法实现Kasiski测试法的核心思想是寻找重复出现的密文序列这些重复很可能对应着相同的明文片段如the等高频词汇被相同的密钥部分加密。def find_repeated_sequences(ciphertext, min_len3): 寻找重复出现的密文序列 sequences {} for length in range(min_len, len(ciphertext)//2): for i in range(len(ciphertext)-length1): seq ciphertext[i:ilength] if seq in sequences: sequences[seq].append(i) else: sequences[seq] [i] return {seq: positions for seq, positions in sequences.items() if len(positions) 1} def calculate_key_length_candidates(ciphertext): 计算可能的密钥长度 sequences find_repeated_sequences(ciphertext) distances [] for seq, positions in sequences.items(): for i in range(1, len(positions)): distances.append(positions[i] - positions[0]) # 计算所有距离的最大公约数 from math import gcd from functools import reduce overall_gcd reduce(gcd, distances) return [d for d in range(1, overall_gcd1) if overall_gcd % d 0]2.2 重合指数法验证Kasiski测试法有时会产生多个候选长度我们需要用重合指数法进一步验证def coincidence_index(text): 计算文本的重合指数 counts Counter(text) total len(text) return sum(cnt*(cnt-1) for cnt in counts.values()) / (total*(total-1)) def test_key_lengths(ciphertext, max_len20): 测试不同密钥长度的重合指数 results [] for length in range(1, max_len1): groups [ciphertext[i::length] for i in range(length)] avg_ci sum(coincidence_index(group) for group in groups) / length results.append((length, avg_ci)) return sorted(results, keylambda x: abs(x[1]-0.065))3. 密钥还原技术3.1 频率匹配算法确定密钥长度后我们可以将密文分组每组使用单字母凯撒密码的破解方法def frequency_attack(ciphertext_group, reference_freq): 对单字母加密的密文进行频率分析攻击 best_shift 0 min_diff float(inf) for shift in range(26): decrypted .join(chr((ord(c)-ord(a)-shift)%26 ord(a)) for c in ciphertext_group) current_freq generate_frequency_reference(decrypted) # 计算与参考频率的差异 diff sum(abs(current_freq.get(char,0)-reference_freq.get(char,0)) for char in reference_freq) if diff min_diff: min_diff diff best_shift shift return chr(best_shift ord(a))3.2 多线程暴力破解优化对于较长的密钥我们可以使用多线程加速最后的暴力破解阶段from concurrent.futures import ThreadPoolExecutor def brute_force_vigenere(ciphertext, key_length, reference_freq): 多线程暴力破解维吉尼亚密码 def test_key(key): decrypted vigenere_decrypt(ciphertext, key) english_score sum(decrypted.count(common) for common in [ the , and , ing ]) return (english_score, key) with ThreadPoolExecutor() as executor: # 生成所有可能的密钥组合 from itertools import product possible_keys (.join(key) for key in product(abcdefghijklmnopqrstuvwxyz, repeatkey_length)) results list(executor.map(test_key, possible_keys)) return max(results, keylambda x: x[0])[1]4. 完整破解流程与实战案例现在我们将所有步骤整合成一个完整的破解流程并用一个实际案例演示def full_vigenere_attack(ciphertext, reference_freq): 完整的维吉尼亚密码破解流程 # 步骤1确定密钥长度 kasiski_lengths calculate_key_length_candidates(ciphertext) ci_results test_key_lengths(ciphertext, max(kasiski_lengths)5) likely_length ci_results[0][0] # 步骤2分组进行频率分析 groups [ciphertext[i::likely_length] for i in range(likely_length)] key_guess .join(frequency_attack(group, reference_freq) for group in groups) # 步骤3优化最终密钥 final_key brute_force_vigenere(ciphertext, likely_length, reference_freq) return final_key, vigenere_decrypt(ciphertext, final_key) # 测试案例 ciphertext vptnvffuntshtarptymjwzirappljmhhqvsubwlzzygvtyitarptyiougxiuydtgzhhvvmumshwkzgstfmekvmpkswdgbilvjljmglmjfqwioiivknulvvfemioiemojtywdsajtwmtcgluysdsumfbieugmvalvxkjduetukatymvkqzhvqvgvptytjwwldyeevquhlulwpkt key, plaintext full_vigenere_attack(ciphertext, reference_freq) print(f破解出的密钥: {key}) print(f解密后的明文: {plaintext})这个案例中我们的算法成功破解出了密钥cipher解密后的明文是莎士比亚十四行诗的第18首开头部分。5. 进阶优化与注意事项在实际应用中我们还需要考虑以下几个优化点预处理密文移除非字母字符并统一大小写def preprocess_text(text): return .join(c.lower() for c in text if c.isalpha())处理非英语文本需要相应语言的频率表def load_language_profile(language): # 加载不同语言的频率特征 profiles { english: {e: 0.127, t: 0.091, ...}, french: {e: 0.146, a: 0.074, ...}, # 其他语言配置 } return profiles.get(language.lower())评估解密质量使用更复杂的英语特征评估def english_score(text): common_words set([the, and, have, that, for]) words text.split() return sum(1 for word in words if word in common_words) / len(words)在实现过程中有几个常见陷阱需要注意密钥长度判断错误当密文较短时Kasiski测试法可能失效此时应更依赖重合指数法频率分析偏差非常规文本如技术文档可能不符合标准频率分布计算效率问题密钥长度超过5时暴力破解部分需要优化

更多文章

前端开发 2026/6/1 22:14:53

TranslucentTB高效配置指南：场景化方案实现Windows任务栏个性化

TranslucentTB高效配置指南：场景化方案实现Windows任务栏个性化【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 作为一款开源…

张开发

前端开发 2026/6/3 6:15:40

番茄小说下载器：终极指南：如何一键打造个人专属数字图书馆？

番茄小说下载器：终极指南：如何一键打造个人专属数字图书馆？ 【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 你是否曾经遇到过这样的情况&am…

张开发

前端开发 2026/6/1 22:14:53

SEO公司与外包SEO哪个更有优势

SEO公司与外包SEO哪个更有优势？深入分析与解答在当今数字营销领域，搜索引擎优化（SEO）无疑是提升网站流量、提高品牌知名度的关键手段。面对SEO服务的选择，很多企业常常面临一个难题：是选择聘请专业的SEO公…

张开发

前端开发 2026/6/1 22:14:54

AudioSeal Pixel Studio实战教程：水印嵌入与ASR识别准确率相关性量化研究

AudioSeal Pixel Studio实战教程：水印嵌入与ASR识别准确率相关性量化研究 1. 音频水印技术概述音频数字水印技术正在成为保护数字内容版权的重要工具。AudioSeal Pixel Studio基于Meta开源的AudioSeal算法，提供了一套完整的音频水印解决方案。 1.1 水…

张开发

前端开发 2026/6/5 2:59:10

LFM2.5-1.2B-Thinking-GGUF集成Python爬虫实战：智能数据采集与内容分析

LFM2.5-1.2B-Thinking-GGUF集成Python爬虫实战：智能数据采集与内容分析 1. 场景与痛点分析电商运营团队每天需要监控数千条商品评论，传统爬虫只能抓取原始文本，人工筛选有价值信息耗时耗力。新闻聚合平台面临类似困境，海量资讯…

张开发

前端开发 2026/6/5 8:25:34

PyTorch模型可视化与调试：使用Netron与TensorBoard实战技巧

PyTorch模型可视化与调试：使用Netron与TensorBoard实战技巧 1. 为什么需要模型可视化与调试工具深度学习模型开发过程中，我们常常会遇到这样的困惑：模型结构太复杂难以理解、训练过程像黑盒子、出了问题不知道从哪查起。这时候&#xff0c…

张开发

前端开发 2026/6/3 5:15:05

Phi-4-mini-reasoning加速深度学习：卷积神经网络（CNN）模型设计与调优实战

Phi-4-mini-reasoning加速深度学习：卷积神经网络（CNN）模型设计与调优实战 1. 引言：当AI开始设计AI 在图像分类任务中，我们常常陷入这样的困境：面对海量的网络结构选择和超参数组合，即使是有经…

张开发

前端开发 2026/6/4 23:08:38

Qwen3.5-9B-AWQ-4bit Codex使用技巧迁移指南：如何用好开源代码模型

Qwen3.5-9B-AWQ-4bit Codex使用技巧迁移指南：如何用好开源代码模型 1. 从Codex到开源模型的平滑过渡如果你已经习惯了GitHub Copilot（基于Codex）的智能代码补全，切换到开源模型Qwen3.5-9B-AWQ-4bit可能会有些不适应。但别担心&…

张开发

前端开发 2026/6/3 8:01:16

Pixel Mind Decoder 多语言情感解码能力展示与评测

Pixel Mind Decoder 多语言情感解码能力展示与评测 1. 开篇：情感识别的语言边界挑战情感识别技术发展到今天，单语言分析已经相对成熟。但当面对"我爱你"和"I love you"这样的双语表达时，机器能否像人类一样理解这是相…

张开发

前端开发 2026/6/3 5:40:43

从FEE到FLS：深入Autosar存储栈底层，搞懂Flash模拟EEPROM的完整流程

从FEE到FLS：深入Autosar存储栈底层，搞懂Flash模拟EEPROM的完整流程在汽车电子领域，非易失性存储管理一直是嵌入式系统设计的核心挑战之一。当工程师需要在片内Flash上实现类似EEPROM的细粒度数据更新功能时，Autosar存储协议栈提…

张开发

前端开发 2026/6/5 10:26:31

【深度学习】AdamW优化器为何在Transformer中表现更优？解析权重衰减与自适应学习率的解耦设计

1. 从Adam到AdamW：优化器的进化之路第一次用AdamW训练Transformer模型时，我盯着损失曲线看了半天——这收敛速度比普通Adam快了近30%，验证集准确率还高出2个百分点。作为从SGD时代一路摸爬滚打过来的算法工程师，这种提升幅度让我…

张开发

前端开发 2026/6/4 17:17:20

如何免费解锁WeMod专业版功能：一个游戏玩家的真实体验

如何免费解锁WeMod专业版功能：一个游戏玩家的真实体验【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 作为一名热爱游戏的玩家，你…

张开发

用Python实战破解维吉尼亚密码：从频率分析到密钥还原（附完整代码）

最新文章

.NET 11原生AI推理引擎深度解密：如何绕过ML.NET抽象层直驱ONNX Runtime 1.16 SIMD指令集？

告别BIGMAP水印！免费搭建GeoServer离线地图服务：从TIF/SHP数据到OpenLayers展示的保姆级教程

FPGA项目选RAM别纠结！单口、伪双口、真双口RAM性能实测对比（基于Artix-7开发板）

Day05：大模型生产环境常见问题与排障科普笔记

告别Makefile烦恼：用STM32CubeIDE一站式搞定ROS1 rosserial库的集成与编译

iOS企业应用分发太麻烦？手把手教你用MDM实现从上传IPA到员工手机自动安装的全链路

推荐文章

相关文章

分享文章

更多文章

TranslucentTB高效配置指南：场景化方案实现Windows任务栏个性化

番茄小说下载器：终极指南：如何一键打造个人专属数字图书馆？

SEO公司与外包SEO哪个更有优势

AudioSeal Pixel Studio实战教程：水印嵌入与ASR识别准确率相关性量化研究

LFM2.5-1.2B-Thinking-GGUF集成Python爬虫实战：智能数据采集与内容分析

PyTorch模型可视化与调试：使用Netron与TensorBoard实战技巧

Phi-4-mini-reasoning加速深度学习：卷积神经网络（CNN）模型设计与调优实战

Qwen3.5-9B-AWQ-4bit Codex使用技巧迁移指南：如何用好开源代码模型

Pixel Mind Decoder 多语言情感解码能力展示与评测

从FEE到FLS：深入Autosar存储栈底层，搞懂Flash模拟EEPROM的完整流程

【深度学习】AdamW优化器为何在Transformer中表现更优？解析权重衰减与自适应学习率的解耦设计

如何免费解锁WeMod专业版功能：一个游戏玩家的真实体验