当前位置: 首页 > news >正文

学做美食交流网站县区网站集约化平台建设研究

学做美食交流网站,县区网站集约化平台建设研究,c 可以用来做网站吗,上海4a广告公司排名本文主要是介绍借助阿里云免费的大模型额度来做高质量的图转文识别#xff0c;图片转文字#xff0c;或者文字识别都可以使用#xff0c;比传统的OCR模式要直接和高效很多 。 本文使用的技术是spring ai qwen vl 。 Qwen vl有 100万Token 免费额度#xff0c;可以用来免费…本文主要是介绍借助阿里云免费的大模型额度来做高质量的图转文识别图片转文字或者文字识别都可以使用比传统的OCR模式要直接和高效很多 。 本文使用的技术是spring ai qwen vl 。 Qwen vl有 100万Token 免费额度可以用来免费做图片识别实现简单按本文方案一步一步做就可以实现。 同时 Qwen vl模型也是一个开源模型可以自己部署实现类似的 免费调用效果 7B的模型就可以实现很好的效果了。 利用大模型提升Java图文识别的效率与准确性 在java开发场景中我们经常遇到需要处理图文识别的问题。传统的解决方法通常是采用OCR技术但其准确性和稳定性往往不尽人意。随着技术的进步现在利用大模型进行java图文识别成为可能并且能够提供更加出色的效果。通过引入专门训练的大模型可以大大提高java图文识别的准确性与效率。这样的转变意味着开发者不再受限于传统OCR解决方案所带来的局限性在实现更高质量java图文识别的同时也极大地简化了开发流程。无论是对于个人项目还是企业级应用来说采用大模型来支持java图文识别都是一个非常值得尝试的选择。它不仅能够有效提升用户体验还能帮助开发者节省大量时间与精力投入到其他重要领域。因此当你的项目中有涉及到java图文识别的需求时考虑一下使用最新的大模型技术吧这将为你的应用程序带来前所未有的改变。本例子使用java spring ai和国产大模型qwen vl来做样例您也可以换成其他实现。 Spring AI框架概述 在过去Java 缺乏一个统一且高效的 AI 应用框架这限制了开发者在 Java 生态系统中快速集成和使用 AI 功能的能力。为了解决这一问题Spring 团队推出了 Java Spring AI这是一个专为 AI 工程设计的应用框架。它将 Spring 生态系统的设计原则如可移植性和模块化设计应用到了 AI 领域并支持 POJOs 作为应用程序的构建块。 Java Spring AI 的核心优势在于它提供了一套统一的接口可以标准化不同 AI 提供者的接口实现使得开发者只需编写一次代码通过修改配置即可轻松切换不同的 AI 服务提供商。此外它与现有的 Spring 生态系统和 Java 的面向对象编程完美兼容极大地简化了 AI 组件的集成过程。例如在图文识别等应用场景中Java Spring AI 可以帮助开发者快速搭建高效且易于维护的 AI 应用程序。 Qwen VL多模态大模型介绍 Qwen VL是一款专为图像和视频识别设计的多模态大模型在国内技术水平领先。它在思南大模型评测中表现优异仅排在国际知名模型GPT与Claude之后并且在中国同类模型中位居首位。同时在Hugging Face视觉大模型竞技场里Qwen VL同样保持了中国第一的位置。欢迎各界人士参与到这些平台中来通过实际测试体验并投票支持您喜爱的模型。此外Qwen-VL-Plus及Qwen-VL-Max版本现提供限时免费试用机会用户可直接访问通义千问官网或下载通义千问APP以享受Max版本的强大功能。 Spring AI Alibaba概述简化阿里云大模型应用开发 Spring AI Alibaba是Spring AI框架针对阿里云百炼大模型系列的一个实现旨在简化基于阿里云通义大模型的AI应用开发。它支持多种生成式任务如对话、文生图、文生语音等并提供了包括OutputParser、Prompt Template在内的实用工具。通过使用Spring AI Alibaba开发者能够快速接入国产大模型例如通义万象和通义千问从而为业务增加更多智能化能力。其核心优势在于标准化了不同AI供应商的接口使得仅需修改配置即可切换底层AI服务提供商极大提高了开发效率和灵活性。此外Spring AI Alibaba还支持对接OpenAI及其他本地部署的模型进一步拓宽了应用场景。 使用Spring AI Alibaba实现图文识别的详细指南 基于Spring AI Alibaba进行图文识别主要涉及到环境配置、依赖引入、API密钥设置以及具体的读图代码构建。下面将详细地按照这些步骤来进行说明。 前置准备 确保您的开发环境满足以下条件 JDK版本为17或以上。 Spring Boot版本为3.3.x及以上。 申请通义千问的API Key 访问阿里云百炼页面并登录您的阿里云账号。 开通“百炼大模型推理”服务并等待开通成功的短信通知。 开通成功后再次访问百炼页面点击右上角的小人图标 - API-KEY - 创建新的API-KEY生成API Key并记录下来。 配置通义千问API Key 在您的操作系统环境中执行如下命令来设置API Key: export AI_DASHSCOPE_API_KEY您的有效API-Key 开通通义万象图像生成模型 登录到百炼控制台。 在左侧菜单中选择“模型广场”找到图像生成部分下的“通义万象”模型。 点击“API调用”按钮进入详情页在顶部获取到模型的英文名qwen-vl-max-latest作为后续配置使用。 Maven配置 为了能够顺利使用Spring AI Alibaba相关功能您需要在项目的pom.xml文件中添加特定的仓库信息和必要的依赖项 添加Spring仓库 repositoriesrepositoryidsonatype-snapshots/idurlhttps://oss.sonatype.org/content/repositories/snapshots/urlsnapshotsenabledtrue/enabled/snapshots/repositoryrepositoryidspring-milestones/idnameSpring Milestones/nameurlhttps://repo.spring.io/milestone/urlsnapshotsenabledfalse/enabled/snapshots/repositoryrepositoryidspring-snapshots/idnameSpring Snapshots/nameurlhttps://repo.spring.io/snapshot/urlreleasesenabledfalse/enabled/releases/repository/repositories引入必需依赖 dependenciesdependencygroupIdcom.alibaba.cloud.ai/groupIdartifactIdspring-ai-alibaba-starter/artifactIdversion1.0.0-M3.1/version/dependency!-- 其他项目所需依赖 -- /dependencies同时别忘了设置Spring Boot的父级项目信息 parentgroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-parent/artifactIdversion3.3.4/versionrelativePath/ /parent构建图文识别Controller 接下来定义一个REST控制器用于处理图文图片上传及文本识别请求。这里我们将默认提示设为识别图中的文字并通过Flux异步流式返回结果。 RestController RequestMapping(/ai) public class HandwritingRecognitionController {private final ChatModel chatModel;public HandwritingRecognitionController(ChatModel chatModel) {this.chatModel chatModel;}Value(classpath:handwriting.png) // 图文图片路径private Resource handwritingResource;private static final String DEFAULT_PROMPT 识别图中的文字;private static final String HANDWRITING_MODEL qwen-vl-max-latest; // 使用的图文识别模型GetMapping(/recognizeHandwriting)public FluxString recognizeHandwriting(RequestParam(value prompt, required false, defaultValue DEFAULT_PROMPT) String prompt,HttpServletResponse response) throws Exception {response.setCharacterEncoding(UTF-8);ListMedia mediaList List.of(new Media(MimeTypeUtils.IMAGE_PNG, handwritingResource));UserMessage message new UserMessage(prompt, mediaList);message.getMetadata().put(DashScopeChatModel.MESSAGE_FORMAT, MessageFormat.IMAGE);FluxChatResponse fluxResponse chatModel.stream(new Prompt(message, DashScopeChatOptions.builder().withModel(HANDWRITING_MODEL).withMultiModel(true).build()));return fluxResponse.map(resp - resp.getResult().getOutput().getContent());} } 请确保在src/main/resources/目录下放置一张名为handwriting.png的图文图片作为测试样本。 完成上述所有步骤之后启动您的Spring Boot应用程序并通过浏览器或其他客户端工具向http://localhost:8080/ai/recognizeHandwriting发送GET请求即可开始体验图文文字识别功能了。 以上就是利用Spring AI Alibaba实现图文识别功能的具体步骤与代码示例。
http://www.w-s-a.com/news/807895/

相关文章:

  • 免费制作论坛网站模板免费下载北京网站制作长沙
  • 旅游网网站建设网站如何自己做seo
  • 如何验证网站所有权做二手家具回收哪个网站好
  • 做哪种网站赚钱项目开发流程
  • 网站建设和网站网络推广网站建设软件定制
  • 站长工具网址查询全球云邮登陆网站
  • 宁波 住房和建设局网站网上发帖推广
  • 平面设计在线网站工业设计公司有哪些
  • 福州网站设计外包公司网站做的比较好
  • 如何设计网站首页网站开发综合技能实训心得体会
  • 用织梦做的网站好用吗w网站链接如何做脚注
  • 东莞做网站公司在哪哪里有网站培训的
  • 做宣传 为什么要做网站那重庆网站建设公司在线联系
  • 网站设计制作售价多少钱制作图片的软件是
  • 网站验证码目录简单带数据库的网站模版
  • 制作网站用c#做前台网站建设专题的意义
  • 广西建设职业技术学院教育网站牡丹区建设局网站
  • 网站后台怎么用ftp打开上海外贸进出口有限公司
  • 淘宝建设网站的意义大学生做那个视频网站
  • 如何提高你的网站的粘性建设银行流水网站
  • 微信h5在哪个网站做泰州专业网站制作公司
  • 现在.net做网站的多吗建设工程造价网
  • pc访问手机网站跳转违法网站开发人员
  • 网站前端做报名框wordpress 启动慢
  • 沈阳做网站客户多吗前端可以做网站吗
  • 网站设计规划书新媒体营销策略分析
  • dw个人网站主页怎么做天津工程信息建设网
  • 顺义做网站的公司网站页面设计基础教程
  • 安阳哪个公司做网站好企业没有做网站有的坏处
  • 网站开发有必要用php框架wordpress分页导航代码