ChatGPT 可以识别图像:使用多模态功能的 10 种最佳方式

147小编 196 2024-12-22

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!

欢迎来到未来,现在 ChatGPT 不仅能交谈,还能“看见”!是不是令人震惊?

以下是你可以在 ChatGPT 聊天窗口中使用多模态图像识别功能的 10 种非常有用的方式:

1.语言翻译

想象一下,你正在旅行,遇到一个看起来很重要的告示牌,但不幸的是,它的语言对你来说如同谜语般难懂。我们都遇到过这样的情况,对吧?

漫步在某个古老的欧洲小镇的鹅卵石街道上,你偶然发现一个古老的告示牌。它很有趣,也很神秘,但是是用意大利语写的。你的意大利语就像这个告示牌一样生锈。你该怎么办?拍张照片,把它传给 ChatGPT!

“嘿 ChatGPT,我这里有一个告示牌,感觉就像一只猫误入了狗展一样迷茫。你能帮我翻译一下并提供一些背景信息吗?”

这不仅仅是为了破解外文菜单,以免误点蜗牛(当然,除非你喜欢这种食物,那我不做评价!)。更重要的是,这是在打破语言障碍,建立沟通,让语言成为通往新世界的大门,而不是阻碍。

想象一下,如果你是一个学生或研究者,想要翻译整整一页的文本,这将为你节省大量时间。

2.医疗指导

我们都有这样的时刻:发现自己身上突然出现了新的斑点、肿块或皮疹。与其直接跳入 WebMD 的信息海洋(你知道的,那种会让你觉得自己得了18世纪某种罕见病的深渊),不如让 ChatGPT 来帮忙。

“嘿 ChatGPT,我今天醒来发现自己身上像是一幅连点成图的画。你能看看我皮肤上的这个图像,并给我一些初步建议吗?”

ChatGPT 通常会先给你一个免责声明,告诉你它不是医生,然后提供一些初步建议,帮你在就医前理清思路。你得承认,这种未来科技简直太棒了!

这主要是为了提供第一步帮助,那种“嘿,这个我应该担心吗?”的时刻。毕竟,谁想花几个小时在诊所的候诊室里,最后却被告知那只是虫咬?我可不想!

重要提示: 确保不要在图片中包含任何面部特征,因为 ChatGPT 被限制无法分析含有人脸的图像。

3.教育辅导

我们都经历过这种情况:面对一道数学题,觉得像是在看象形文字,或者看到一张历史地图,仿佛是在解读藏宝图。拍张照片,把它传给 ChatGPT,看它如何施展“魔法”!

注意:如果你是在处理数学问题,确保你启用了 Wolfram 插件。

“ChatGPT,这道题有比我奶奶的填字游戏更多的字母和符号!你能帮我解答吗?还有这张地图是怎么回事?是不是在标记宝藏位置?”

学习难道不应该是有趣的吗?

这对于交易图表分析也非常有用——推特用户@youraimarketer就展示了这一点:

4.时尚建议

准备出门,但感觉你的穿搭风格就像恐怖片里的受害者一样在求救?

我们都遇到过衣橱难题:衣服堆得满满的,但还是不知道穿什么。就像你明明有一冰箱的食物,却还是决定点外卖。

“嘿 ChatGPT,准备出门了,但我的穿搭风格实在太平淡了。你能帮我看看并给些建议,提升一下我的风格吗?”

谁会想到你奶奶的胸针和那些遗忘已久的靴子竟然可以组合出如此别致的造型?

5.健身姿势纠正

你在镜子前摆姿势,但总觉得哪里不对?也许你的平板支撑看起来更像一座塌陷的桥而不是坚固的木板。不要担心(当然,继续出汗锻炼,但你懂我的意思)。

你可以拍张照片来展示你的动作(不要包含人脸,我们保持匿名!ChatGPT 不需要看到你的表情)。

“看看我的勇士式姿势,我需要做哪些调整?”

没多久,ChatGPT 就会分析你的姿势,确保你不会因为姿势不对而受伤。我们理解,每个人的健身之旅都是独一无二的。无论你是在举重、跑步还是练瑜伽,正确的姿势是关键!

6.烹饪指导

ChatGPT 在食谱和烹饪指导方面已经相当出色了,尤其是当你给它列出一张食材清单时。现在你不需要再站在冰箱前,眼睛在一根孤零零的胡萝卜和一块半吃完的奶酪之间游移,想知道是否可以用这些做出一顿美味的佳肴。

拍张照片,然后……

“ChatGPT,这是我冰箱里的食材。我可以做什么菜呢?”

ChatGPT 会把这些食材变成一场味觉盛宴。

7.家居装修建议

你盯着客厅,觉得它比“哇”更像“唉”?你梦想着拥有一个能体现你个性的空间,但却陷入了装饰难题?

拍一张房间的照片,让 ChatGPT 成为你的室内设计顾问!无论你住在一个温馨的角落公寓,还是宽敞的郊区住宅,你的家都将变得更温馨。

“嘿 ChatGPT,这是我的客厅。感觉有点平淡。你能帮我提升一下风格吗?我在考虑波西米亚风格,但我也愿意听取其他建议。哦,还有,我的复古灯要放在哪里合适呢?”

没多久,ChatGPT 就会像 HGTV 的明星一样给出建议。色彩搭配?搞定!家具摆放得更流畅?双重搞定!光线布置得更加温暖?三重搞定!感觉就像在家里上演了一场家装节目!

8.野生动物和宠物行为理解

你有没有半夜看着你的猫表演像 Cirque du Soleil(太阳马戏团)那样的特技,心想,“小胡子,你在干嘛?”或者你在远足时偶遇了一只神秘的小动物,心想,“这是什么生物?”

拍一张照片并询问吧,因为 ChatGPT 将成为你的野生动物解说员和宠物心理学家!

“嘿 ChatGPT!我在后院发现了一只鸟,我从来没见过这种鸟。你能告诉我它是什么品种,它喜欢吃什么吗?哦,还有,这是我家狗狗 Max 的照片。他最近一直在花园里挖洞,你知道这是为什么吗?”

ChatGPT 会向你抛出物种特征、趣味知识,并提供定制化的建议,帮助你理解和照顾你的毛茸茸、羽毛状或鳞片状的小伙伴!

9.植物识别

在你的花园里偶然发现了一株神秘的植物,眯起眼睛,挠着头?或者,也许你家里有一株盆栽植物,看起来有些不太健康?

拍一张照片然后……

“嘿 ChatGPT,我刚刚在后院发现了这株植物,知道它是什么吗?”

在你还没说完“叶绿素”之前,ChatGPT 就会启动它的植物学知识,迅速告诉你植物的名字并提供护理建议。无论它是向日葵还是一株 Sneezewort(篙草),你将得到关于适合的生长环境、浇水规律的详细建议,或许你终于能让那盆罗勒活下来了!

10.光学字符识别 (OCR) 功能

想象一下——你手里有一堆旧收据、文件,或者是几张含义模糊的笔记。与其自己费力解读这些杂乱的内容,不如拍张照片上传,让 ChatGPT 替你完成繁重的工作!

“你能帮我读取这张收据的内容并将其输入到一个表格中吗?我还会发送更多的收据,请你把它们一起加到表格里。”

还有一个亮点——如果你遇到了一道看起来像是用古代符文写成的考试题,拍张照片传给 ChatGPT,它会成为你的私人导师,分解题目,提供答案,让你觉得自己仿佛成了天才!不过,我为老师们感到惋惜。

关于 ChatGPT 新的多模态图像功能的常见问题

ChatGPT 现在支持语音和图像功能。你可以通过语音对话或展示图像与 ChatGPT 进行更直观、有趣的互动。例如,你在旅行中拍了一张地标的照片,现在你可以与 ChatGPT 实时对话,讨论这张照片的内容!或者,你在家中苦思晚餐该吃什么,拍一张冰箱和食品柜的照片,马上就会收到晚餐建议!

对于 Plus 用户和企业用户,这项功能可以在 iOS 和 Android 上使用(只需在设置中选择开启),而图像功能则可以在所有平台上使用。

使用起来非常简单!点击拍照按钮来拍摄或选择图片。如果你在使用 iOS 或 Android 设备,先点击加号按钮。你可以讨论多张图片,也可以使用绘图工具引导对话。

ChatGPT 的图像理解功能是由多模态 GPT-3.5 和 GPT-4 模型支持的。这些模型能够将语言推理能力应用于各种图像,包括照片、截图以及包含文字和图片的文件。

视觉模型有时可能会误解图像,特别是在一些高风险领域。

ChatGPT 一直与 Be My Eyes 应用紧密合作,这是一款为盲人和低视力人士设计的应用,旨在帮助理解和限制新功能的使用场景。这种合作使新功能既“有用又安全”。

注意: OpenAI 严格限制了 ChatGPT 直接分析图像中人物的能力,以尊重个人隐私。

不过用户仍然认为,即使图像中包含背景中的人物,进行一般性对话仍然是很有价值的。请记住,详细分析个人形象是不允许的!

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!

上一篇: 书法知识 考考你知多少?
下一篇: 7个超实用的微信小程序,满足工作、生活、学习各种需求
最新文章