GPT-4V功能倒退了?亲测4条实例后的结果

什么是GPT-4V

GPT-4V是OpenAI在2023年11月份发布的API。可以让 GPT-4 分析图像以提供图像描述和文本阅读的图像识别技术。还可以回答有关图像的问题。它不仅能理解文字,还能分析图片和声音。想象一下,一个可以”看”和”听”的AI,这对网络营销来说意味着什么?

文章中所使用到的测试示例时效基于此篇文章发布时。

用GPT-4V来分析社交媒体内容时,笔者惊讶地发现,它可以告诉哪些图片和视频更能吸引目标客户。可以上传一张图片,GPT-4V会分析出哪些元素最吸引人,甚至建议如何改进营销视觉内容。

GPT-4V有时也被称做GPT-4 with Vision。关于具体说明可以参考以下官方网站。

GPT-4 Vision

目录

对于收据的识别。

亲测GPT-4V对于收据图片的识别以及具体内容分析能力。为了增加难度还特意找来一张皱褶的。

基于上述测试,对于收据,发票的统计,整理等工作ChatGPT可以提高很大的效率。

结果是令人满意的。

首先用日语询问「三张收据的总计金额是多少?」

ChatGPT给出的答案为:

  1. For the first receipt from Kamegaya Fit Care DEPOT, the total amount is ¥953.
  2. The second receipt from まいばすけっと (My Basket) shows a total of ¥845.
  3. The third receipt from Watt’s lists a total of ¥990.

Now, I will sum these amounts to give you the combined total.

三张收据的总金额是2788日元。

答案准确!

其次询问「三张的日期?」

收据的日期如下:

  1. Kamegaya Fit Care DEPOT 的收据日期是2022年8月27日。
  2. まいばすけっと(My Basket)的收据日期是2022年9月4日。
  3. Watt’s 的收据日期是2022年9月17日。

完全正确。

第三个问题「三张的消费税总计金额是多少?」


根据您提供的收据信息,消费税(外税)的合計金額如下:

  1. 对于Kamegaya Fit Care DEPOT的收据,消费税为70日元。
  2. まいばすけっと(My Basket)的收据显示消费税为62日元。
  3. Watt’s的收据上消费税为100日元。

现在,我会将这些税额加起来给出总消费税金额。

三张收据上消费税(外税)的总金额是232日元。

识别与计算正确!

基于上述测试,对于收据,发票的统计,整理等工作等GPT-4V可以提高很大的效率。

关于收据图像,不局限于具体内容或领域,可以发散思考的应用场景有:

  1. 购物行为分析: 通过分析收据上的项目和价格,AI可以帮助商家理解顾客的购物习惯,优化库存和促销活动。
  2. 智能预算助手: 为个人用户开发应用程序,通过扫描收据,自动记录和分类消费,管理预算和支出。
  3. 忠诚度奖励系统: 零售商可以使用收据图像来验证购买,自动为顾客积分或应用折扣,增强客户忠诚度。
  4. 环境影响跟踪: 通过分析收据上的商品,可以评估顾客购买行为对环境的影响,鼓励更环保的消费选择。
  5. 健康和营养监控: 分析食品购买收据,提供个性化的营养建议和健康饮食建议。
  6. 智能文档管理: 为企业提供解决方案,自动归档和索引收据和发票,简化会计和审计过程。
  7. 慈善和税务规划: 自动识别和计算可抵税的慈善捐赠或其他税务相关支出,帮助个人和企业规划税务。
  8. 二手商品市场: 通过验证收据证明商品的原始购买信息,增加二手商品市场的透明度和信任度。
  9. 食物浪费减少: 根据食品购买收据,推算可能的食物剩余和浪费情况,提供减少浪费的建议。
  10. 历史购物数据挖掘: 对于研究机构来说,收据是研究过去消费者行为和经济趋势的宝贵资料。
  11. 自动化报销流程: 对于经常出差的职员,可以自动扫描收据并填写报销单,减少人工工作量。
  12. 物品追溯系统: 对于具有保证期的商品,收据可以用来快速验证购买日期和保修状态。

对于知名品牌的测试

笔者分别找出了苹果,BP全称为British Petroleum,Kool-Aid来进行测试。

GPT-4V给出了准确的结果。并且还提供出了业务范围的介绍。

对于大学校徽的识别。

这次用中文对于京都大学和早稻田大学进行测试。

在京都大学logo里有文字信息所以能够被准确识别。

但对于没有任何具体信息提示的早稻田大学的校徽却识别错误。
被说成是一个在中国知名的食品品牌“五谷道场”。这显然是不正确的。

对于名人的识别

分别选取了现任美国总统拜登的官方照片,迈克尔杰克逊,以及日本家喻户晓的志村Ken进行测试。

结果是:

根据一篇名为【The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)】的权威论文,内容表示是可以识别名人的。基于目前的时间节点,OpenAI最新的政策是以保护隐私为理由屏蔽了这项对于人物识别的功能。

识别日本的垃圾分类表。

首先用手机随意的拍摄了一张所在区域的垃圾分类表。让GPT-4V去识别。对于图片是什么这个基础问题还是给出了准确答案。

但继续问具体今天,而特意没有说出(12月16日)可以扔什么垃圾时,却无法识别。

接下来分步问今天是什么日期?然后根据今天的日期,对应图片内容,请告诉我今天可以丢什么类型的垃圾?
给出的结果却是图片的日历中没有今天的日期。

正确信息是今天没有任何类型的垃圾可以扔。

然后让给出当天日期区域的背景颜色。正确是白色或者是没有颜色。但给出的却是蓝色。

最后让其标出今天日期(12月16日)的位置,结果却是这样:

所以结论是对于日本的垃圾分类表的分析与具体识别,还是差强人意的。

结论

GPT-4V对于图片整体识别还是可以的。但是对于细节分析以及识别后推演的逻辑判断功能上还是差强人意的。

所以不要看网上其他内容说的神乎其神,还是要有自己的实操和判断的。

🌟 创富JAPAN Telegram专业资讯频道,现已开启!
🔍 点击下面Telegram链接可以直接打开阅览。

https://t.me/chuangfujp

此频道专注于介紹以下相关专业资讯中的精华:
– 生成式AI
– 内容变现,内容营销
– SNS自动化
– 营销联盟
– SNS营销,SNS平台,工具使用等最新信息。
– 对于以上内容的实战经验

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目录