网上冲浪周刊第79期

欢迎阅读本期技术资讯!我们为您介绍了一些有趣的工具,由Vercel开发的高效代码搜索工具Grep 、中国古典诗词学习平台唐韵、延迟语音转文本库RealtimeSTT 。此外,还推荐了浙江大学开源的大语言模型教材、LLM 课程以及高性能算法交易平台和事件驱动回测工具 。

https://www.pexels.com/zh-cn/photo/18819415/


欢迎来到第79期 , 给大家拜个晚年,祝大家2025年心有所想,皆能成真 !😄

期待您通过RSS订阅我们:https://www.lifeee.top//atom.xml


推荐阅读

  • 杭州科技企业创新现象:技术与文明的融合: 文章详细介绍了杭州科技企业的创新现象,特别是深度求索、宇树科技和游戏科学等企业的独特地位和影响力。这些企业不仅在技术创新上取得了突破,更在文化与科技的融合上展现了深刻的洞察力和创造力。文章通过具体案例,如深度求索的开源战略、游戏科学的文化自觉技术转化和宇树科技的场景原生创新,展示了杭州科技企业如何将东方智慧与现代科技相结合,推动技术与文明的共同进步。此外,文章还探讨了杭州创新生态的形成,包括政策支持和产学研的深度融合,为科技企业提供了肥沃的土壤,使其在全球科技竞争中占据了重要位置。

  • 阿里同学都在用的开发环境和工具 : 这篇文章详细介绍了阿里巴巴后端开发人员常用的开发环境和工具,旨在帮助开发者提升工作效率。文章涵盖了多种工具,包括在线白板工具、输入法、截图软件、鼠标控制软件、AI工具(如ollama、Bolt.New、DeepL翻译、ChatGPT等)、浏览器插件(如沉浸式翻译、SiderAI助手)、终端工具(如iTerm2、oh-my-zsh、Warp)、Python环境配置、Go开发环境配置、IDE选择(如JetBrains、VSCode)、数据库工具(如MySQL、Redis、MongoDB Compass)等。此外,文章还提供了MacOS Brew的安装和使用指南,以及一些常用的命令和配置技巧。

  • 2024年上半年,一次通过软考高级架构师考试的备考秘诀: 这篇文章详细介绍了作者在2024年上半年通过软考高级架构师考试的备考经验。作者从备考时间线和考试科目两个维度分享了自己的备考策略。备考时间线包括复习前的准备、复习期间的时间安排以及考试时的注意事项。作者建议考生在复习前选择合适的报考科目,加入备考群组以获取支持,并利用AI工具提高复习效率。在复习期间,作者通过观看视频、阅读PPT和做真题来巩固知识点。考试时,作者分享了综合知识、案例分析和论文部分的答题技巧。文章还提到,软考不仅有助于夯实专业基础,还能提升写作能力和结构化思维。最后,作者鼓励考生合理利用备考时间,争取一次性通过考试。



有趣的工具

Grep:由Vercel开发的高效代码搜索工具

Grep是一个由Vercel开发的代码搜索工具,旨在帮助开发者快速搜索GitHub上的代码、文件和路径。该工具支持跨多个GitHub仓库的搜索,能够帮助开发者节省时间并提高开发效率。Grep的界面简洁直观,支持多种搜索功能,包括代码片段、文件名和路径的搜索。

在线地址: https://grep.app/


唐韵:中国古典诗词学习平台

“唐韵”是一个专注于中国古诗词学习的平台,提供了多种经典诗词的展示和学习资源。平台收录了从唐诗到宋词、明清散文等多种文学作品,涵盖苏轼的《临江仙·夜归临皋》《江城子·密州出猎》、归有光的《项脊轩志》、老子的《道德经》、张岱的《湖心亭看雪》、沈复的《浮生六记·闺房记乐》等经典作品。通过这些作品,平台旨在帮助用户更好地学习和理解中国古典文学的魅力。

地址: https://www.chinesepoems.org/


RealtimeSTT:低延迟语音转文本库,支持实时转录和唤醒词激活

RealtimeSTT是一个低延迟、高效的语音转文本库,适用于实时应用。它支持语音活动检测、实时转录和唤醒词激活功能,适用于语音助手和需要快速精确语音转文本的应用场景。项目提供了详细的安装指南、快速启动示例和多种配置选项,支持CPU和GPU加速。此外,项目还提供了测试脚本和示例应用,帮助用户评估和使用该库。

RealtimeSTT

开源地址: https://github.com/KoljaB/RealtimeSTT



宝藏信息

大模型基础:浙江大学开源的大语言模型教材

《大模型基础》是一本由浙江大学语言模型团队编写的开源教材,旨在为对大语言模型感兴趣的读者提供系统性的基础知识和前沿技术介绍。本书第一版涵盖了传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑和检索增强生成等六章内容。每章以一种动物为背景,通过生动的案例讲解具体技术,增加易读性。本书将持续进行月度更新,后续版本将补充更多内容,如大模型推理加速和大模型智能体等。教材提供完整的PDF版本,以及各章节的PDF和相关论文列表,方便读者学习和研究。

Foundations-of-LLMs

书本内容截图

书本内容截图

开源地址: https://github.com/ZJU-LLMs/Foundations-of-LLMs


LLM 课程:系统学习大语言模型的完整指南

llm-course 是一个全面的课程,旨在帮助学习者系统地掌握大语言模型(LLMs)的基础知识、构建方法和应用开发。课程分为三个部分:LLM 基础知识、LLM 科学家和 LLM 工程师。基础知识部分涵盖了数学、Python 和神经网络的核心知识;LLM 科学家部分专注于使用最新技术构建最佳的 LLMs;LLM 工程师部分则侧重于创建基于 LLM 的应用程序并进行部署。课程还提供了互动版本的 LLM 助手,以及一系列 Colab 笔记本和文章,帮助学习者更好地理解和应用所学知识。

大纲

  1. 课程介绍
    • 课程分为三个部分:LLM 基础知识、LLM 科学家、LLM 工程师
    • 提供互动版本的 LLM 助手
  2. LLM 基础知识
    • 数学基础:线性代数、微积分、概率论和统计学
    • Python 编程基础:Python 基础、数据科学库、数据预处理、机器学习库
    • 神经网络基础:神经网络结构、训练和优化、过拟合、多层感知机(MLP)
    • 自然语言处理(NLP)基础:文本预处理、特征提取、词嵌入、循环神经网络(RNNs)
  3. LLM 科学家
    • LLM 架构:Transformer 架构、标记化、注意力机制、文本生成
    • 构建指令数据集:Alpaca 数据集、高级技术、数据过滤、提示模板
    • 监督式微调:全微调、LoRA、QLoRA、Axolotl、DeepSpeed
    • 偏好对齐:偏好数据集、近端策略优化(PPO)、直接偏好优化(DPO)
    • 评估:传统指标、通用基准、任务特定基准、人类评估
    • 量化:基础技术、GGUF 和 llama.cpp、GPTQ 和 EXL2、AWQ
    • 新趋势:位置嵌入、模型合并、多专家模型、多模态模型
  4. LLM 工程师
    • 运行 LLMs:LLM API、开源 LLMs、提示工程、结构化输出
    • 构建向量存储:文档加载、文档分割、嵌入模型、向量数据库
    • 检索增强生成(RAG):协调器、检索器、记忆、评估
    • 高级 RAG:查询构建、代理和工具、后处理、程序化 LLMs
    • 推理优化:Flash Attention、键值缓存、推测解码
    • 部署 LLMs:本地部署、演示部署、服务器部署、边缘部署
    • 保护 LLMs:提示注入、后门攻击、防御措施

llm-course

LLM Engineerig 全景图

开源地址: https://github.com/mlabonne/llm-course

博客:https://mlabonne.github.io/blog/


NautilusTrader: 高性能算法交易平台和事件驱动回测工具

NautilusTrader是一个开源的高性能算法交易平台和事件驱动回测工具,旨在为量化交易者提供一个生产级别的解决方案。平台支持在历史数据上回测自动化交易策略,并且可以将相同的策略部署到实时交易环境中,无需修改代码。NautilusTrader的核心是用Rust语言编写的,确保了高性能和安全性,同时提供了Python原生环境,方便用户开发和部署策略。平台支持多种资产类别(如外汇、股票、期货、期权、加密货币等)和交易场所,允许用户通过模块化的适配器集成任何REST、WebSocket或FIX API。此外,NautilusTrader还提供了丰富的功能,如高级订单类型、条件触发器、多场所交易能力、AI训练支持等。

nautilus_trader

开源地址: https://github.com/nautechsystems/nautilus_trader

文档: https://nautilustrader.io/docs/

网站: https://nautilustrader.io



后记

百闻不如一见,百见不如一试。

🎉 本文同步更新于 https://www.lifeee.top