# 《实战AI大模型》DeepSeek API实战-第01节:实战Java和Python调用DeepSeek API

作者:冰河
星球:http://m6z.cn/6aeFbs (opens new window)
博客:https://binghe.gitcode.host (opens new window)
文章汇总:https://binghe.gitcode.host/md/all/all.html (opens new window)
源码获取地址:https://t.zsxq.com/0dhvFs5oR (opens new window)

沉淀,成长,突破,帮助他人,成就自我。

  • 本章难度:★★☆☆☆
  • 本章重点:主要对如何注册和接入DeepSeek进行简单的介绍,最后通分别通过Java和Python实战调用DeepSeek的API来验证实际效果。

大家好,我是冰河~~

从今天开始,我们正式从实战角度深入学习AI大模型,从实战中积累AI大模型的相关知识。通过对《实战AI大模型》专栏的学习,相信大家都能够从实战角度对AI大模型有一个全新的认识和了解。好了,不多说了,开始今天的内容。

# 一、前言

DeepSeek(杭州深度求索人工智能基础技术研究有限公司)是一家专注于大语言模型(LLM)研发的中国创新型科技公司,成立于2023年7月17日,由幻方量化孵化。其核心产品包括开源推理模型DeepSeek-R1、多模态模型DeepSeek-VL等,以高性能、低成本和开源免费为特色,广泛应用于医疗、编程、应急管理等领域。‌

‌模型架构‌

  • 采用混合专家模型(MoE)和多头潜在注意力(MLA)技术,动态分配计算资源,显著降低算力需求,同时保持高性能(如DeepSeek-V2性能对标GPT-4 Turbo,成本仅1%)。

  • 支持多任务处理,包括代码生成、数学推理、语义分析等,在数学和编程任务上达到GPT-4o水平。

‌开源与部署‌

  • 模型如DeepSeek-R1、DeepSeek-V3等均开源,支持免费商用及本地化部署,适用于数据隐私要求高的场景(如医疗、政府)。

  • 已接入国家超算互联网平台及苏州公共算力服务平台,提供软硬件一体服务。

‌应用场景‌

  • 医疗‌:昆明延安医院通过DeepSeek实现病历智能分析,生成治疗计划时间从5-10分钟缩短至1分钟。
  • 应急管理‌:用于灾害风险评估、救援路径规划等,提升政府应急响应能力。
  • 编程与教育‌:辅助代码生成、学习规划,显著提升效率。

# 二、注册DeepSeek

DeepSeek官网:https://www.deepseek.com/ (opens new window)


点击右上角的API开放平台。


随后出现登录页面。


首次登录进来如下图所示。

# 查看完整文章

加入冰河技术 (opens new window)知识星球,解锁完整技术文章、小册、视频与完整代码