节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下:

重磅消息!《大模型面试宝典》(2024版) 正式发布!

喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以文末加入我们。

最近一位星球成员面试科大讯飞 NLP 算法岗,被疯狂拷打。。。

今天我把他的面经题整理总结一下,希望可以对大家找工作有帮助,喜欢点赞、收藏、关注。

⾃我介绍 介绍⾃⼰的项⽬ 项⽬中数据语料 你怎么评价你⾃⼰构建的数据集的好坏? chatGLM 和 GPT 模型结构⼀样吗 ⼤模型训练⽅式 怎么评价⼈类⾼质量回答的数据集?精⼼处理的数据集作⽤? 强化学习中怎么⽤奖励模型打分?怎么样的分数?奖励模型是怎么得到的? ⽤强化学习的梯度更新是怎么实现的? 什么样的 prompt 是好的 prompt? Instruct 和 prompt 有什么区别? 现在⼤模型有哪些的缺点 模型幻觉怎么解决? ⼤模型对话和传统的 nlp ⼈机对话⽅案有什么区别 (⼈机对话)你怎么知道⽤⼾输⼊之后,触发⼀些问题 传统⼈机对话中⼀个问题给 K 个回复吗 (⼈机对话)相似度怎么计算;这种度量的模型怎么训练? 命名实体识别遇到嵌套识别该怎么做? ⽂本分类中⼀个⽂本有多个类别的话,该怎么做? ⽂本分类中类别不均衡问题怎么解决? ⼤模型的幻觉怎么评测? 什么是⻓⽂本?⼤模型⻓本⽂怎么做? 你项⽬中⻓⽂本⽤的多⻓? tokenizer 的步骤

总结

这次面试涵盖了自然语言处理(NLP)和大型语言模型(LLM)相关内容。

涉及多个关键点,包括个人项目、数据集构建、模型结构、训练方法、强化学习、prompt 设计、模型缺点、对话系统、实体识别、文本分类等

技术交流&资料

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了算法面试和技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:加群 方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流

通俗易懂讲解大模型系列

重磅消息!《大模型面试宝典》(2024版) 正式发布! 重磅消息!《大模型实战宝典》(2024版) 正式发布! 做大模型也有1年多了,聊聊这段时间的感悟! 用通俗易懂的方式讲解:大模型算法工程师最全面试题汇总 用通俗易懂的方式讲解:不要再苦苦寻觅了!AI 大模型面试指南(含答案)的最全总结来了! 用通俗易懂的方式讲解:我的大模型岗位面试总结:共24家,9个offer 用通俗易懂的方式讲解:大模型 RAG 在 LangChain 中的应用实战 用通俗易懂的方式讲解:ChatGPT 开放的多模态的DALL-E 3功能,好玩到停不下来! 用通俗易懂的方式讲解:基于扩散模型(Diffusion),文生图 AnyText 的效果太棒了 用通俗易懂的方式讲解:在 CPU 服务器上部署 ChatGLM3-6B 模型 用通俗易懂的方式讲解:ChatGLM3-6B 部署指南 用通俗易懂的方式讲解:使用 LangChain 封装自定义的 LLM,太棒了 用通俗易懂的方式讲解:基于 Langchain 和 ChatChat 部署本地知识库问答系统 用通俗易懂的方式讲解:Llama2 部署讲解及试用方式 用通俗易懂的方式讲解:一份保姆级的 Stable Diffusion 部署教程,开启你的炼丹之路 用通俗易懂的方式讲解:LlamaIndex 官方发布高清大图,纵览高级 RAG技术 用通俗易懂的方式讲解:为什么大模型 Advanced RAG 方法对于AI的未来至关重要? 用通俗易懂的方式讲解:基于 Langchain 框架,利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法

相关链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。