全文主要针对零基础大学生,学习路线包括:黑,白盒漏洞挖掘,大模型,内网渗透。通篇阅读时常约为3分钟。重点讲述大模型学习路线。
所有内容可从上至下依次学习,也可四个内容一起学习:不过最多建议黑盒+白盒+大模型一起学习。(非个人需求,则内网按照面试要求学两三天即可,等第一段实习后再决定内网学不学)
黑盒挖洞能力是基础:
Xss,越权,文件类漏洞,业务逻辑漏洞,sql注入等等。
(有时间学学js逆向,文件混淆方式。不过这些基本不影响第一段实习能不能找到,因为相关知识面试问不出什么)
白盒挖洞:
Java:
IDEA基本使用
java基础语法,对象,接口继承,文件IO,多态,反射,简单工厂,异常,注解,AOP,反序列化(即可)
常见框架的运行流程,从请求到响应的完整流程:springMVC,springboot,struct2等
sql注入(各种操作sql的框架),RCE,文件操作类,XXE等常见漏洞代码写法
边挖边补遗漏知识
独立审计项目同时,学习java安全基础知识(经典反序列化原理,java三大模板注入原理,URL链子,简单反序列化漏洞调试)
大模型技术
提示词:
普通对话的提示词,项目中的提示词
学习部分越狱提示词
随模型能力,版本的变化,提示词书写的变化
MCP:
工作流程,原理,基本结构
与function call的区别,各自实用场景
好用的MCP有哪些?
了解其它智能体通信协议
Skills:
skills是什么?有什么用?解决什么问题?
玩玩女娲skills,或者适合自己工作场景的相关skills
Harness工程:
Harness是什么?有什么用?解决什么问题?
Harness基本实现原理
RAG:
RAG是什么?解决什么问题?有什么应用?归一化是什么?
API搜索工具:Tavily AI Search,google API,地图天气等功能API......(maybe同时需要爬虫js逆向)
支持RAG功能的AI工具有哪些?
向量数据库原理?本地知识库RAG的检索原理
RAG前置拦截器:Semantic Cache
本地检索的优化思路?
多模态RAG实现
了解聚类,去重,上下文压缩等优化RAG的思路
了解Agentic RAG概念
模型服务商平台:
模型服务商平台有哪些?
各个服务商支持哪些功能!
有哪些优劣点?
(哪些可以免费薅额度?哪些性价比更高?)
Agent:
了解FastApi框架
大模型规范化输出的提示词学习
学习开源项目Hello-Agents:
上下文工程
经典范式ReAct、Plan-and-Solve、Reflection
LangSmith是什么,能干什么
LangGraph + AutoGen + CrewAI
(广泛了解,选择性深入)
harness开源项目的使用与学习
Memory:Text2Mem,Mem0,ReMe,memU-->更前沿的记忆技术
(了解多个Memory原理,选择性深入学习,持续性关注前沿技术)
Karpathy架构
小模型微调(魔搭平台+huggingface网站)-->扩展延申:
小模型微调我认为一般分为动底层参数的微调,或不动底层参数的微调。
第一种对transformer理解要求更高,一般都是第二种不动底层参数的微调,这种微调模式可以了解学习:
可以考虑了解Adapter,学习LoRA(根据设备选择合适模型尝试,要调出效果,并分析不足与改进思路)
大模型学习路线图:
以文字为主,图片可能有略微偏差
以上内容为我个人实际摸索学习后的精炼总结路线,一些内容并没有全面去写,原因如下:
感觉现在大模型概念更新很快,尤其是模型能力的不断增强,不确定未来比如skills,MCP这些能否”活”下来,所以按顺序学完我写的内容后,可自行在MCP,Skills等知识方向,根据需求扩展学习。
至于RAG技术,我觉得即使未来模型能力再强,甚至能够超越现有私域大模型,但在涉及海量私密,个人数据,商业数据的情况下,RAG类似技术应该依旧需要。
额外补充动底层参数的微调学习思路:
线性代数+高数+概统(一点点基础,需要用到了再学)
PyTorch 框架->机器学习(选择性了解即可,学到不懂了再回来补)
深度学习:
(CNN/RNN--仅了解原理及缺点即可)
看懂概念:Dropout,残差连接,梯度下降,反向传播
Mnist实操
模型怎么处理的输入数据,模型训练的内容变化,输入数据到输出数据的过程变化
transformer(FFN,注意力机制,编码器,解密器),
大模型:hugging face网站
内网:
路由器,路由表,交换机,VPN,NAT转换,DMZ,ACL,keberos等概念原理
隧道搭建方式,正向,反向代理
信息搜集,找域控,打域控方式(该知识又会扩展很多漏洞,很多知识)
除非CTF或攻防项目需要,纯自学不要过多接触内网
需要以上学习资料的可以关注GGDog后,加我V免费领取
1:传统安全以面试题为主--大量pdf+docx文件(几年学习过程中搜集的)
2:大模型资料包括:文档+源码+学习网站(学习时从很多机构手中整理的)
由于精力有限,本篇只分析学习内容
至于:
1:怎么安排学习时间?
2:什么时间段,学到什么程度?
3:怎么将大模型与安全的学习路线结合?
相关综合性分析,将在下篇继续!
NISP一级,NISP二级,CISP,CISSP,CISP-PTE,CISP-PTS,CISP-TRE(原IRE),CISP-TRS(原IRS),CiSP-DSG,PMP,国家软考中高级,等等一系列安全证书