跳到内容

再也不用手动给照片打标签。

VisionTagger 使用设备端 AI 为你的图片批量生成标题、描述、关键词等元数据——无需上传,无按张收费。

需要运行 macOS 26 的 Apple Silicon Mac

VisionTagger 使用本地 AI 为一张图片生成的元数据 VisionTagger 使用本地 AI 为一张图片生成的元数据

用已有的上下文获得更智能的结果

告诉 AI 它在看什么,结果会显著提升。添加一个 Context Hint,比如“复古家具店的产品照片”;开启 GPS Location,根据嵌入的坐标获取地名;或者把文件中已有的相机和编辑元数据一起传给模型。每个来源都是可选的,直接注入提示词——这样 AI 就不需要猜测了。

VisionTagger Additional Context 面板,显示上下文来源

精确生成你需要的元数据

从大多数人需要的字段开始——标题、描述和关键词——然后用内容与风格、安全与合规进一步扩展,或添加完全自定义的分区和字段并编写自己的提示词。需要其他语言的输出?VisionTagger 可以使用 macOS 内置翻译功能自动翻译生成的元数据。最终得到的是跨数千张照片的结构化、一致的元数据。

VisionTagger 的内容配置示例,展示可自定义的元数据分区与字段

无缝融入你的工作流

对于 XMP sidecar 和嵌入式元数据,VisionTagger 集成了 ExifTool——一个行业标准、广受信赖的工具。你的元数据会出现在 Adobe Lightroom、Bridge、Capture One、Photo Mechanic 等应用,以及任何读取 XMP 的其他软件中。写回你的 Photos Library,按图片导出 JSON、CSV 或 TXT,或为整次运行生成一个单文件。添加 Finder 标签,便于在 macOS 里快速整理。支持一次选择多个输出并统一配置——这样一次生成就能同时喂给你使用的每个目的地。

VisionTagger 的发布配置示例

自动化,然后忘掉它

两个快捷指令操作——一个用于 Finder 中的文件,一个用于你的 Photos Library——让你无需打开应用就能在后台运行完整流程。设置文件夹自动化、Finder 快速操作,或从命令行触发。使用应用当前的设置,或提供一个保存的预设来获得每次都可复现的结果。

VisionTagger 快捷指令集成,展示自动化操作

一次性购买

€29.99
首发优惠 €24.99

已含增值税(US & CA 除外)

免费试用:100 张图片,无时间限制
一次付款。无重复费用。
单用户。多台 Mac。
下载免费试用版
购买 VisionTagger

通过 FastSpring 安全付款

VisionTagger 常见问题

入门

免费试用怎么用?

免费试用让你在没有时间限制的情况下免费处理最多 100 张图片。你可以在购买前完整体验工作流——模型选择、内置分区、自定义字段和导出选项。

图片与元数据

支持哪些图片格式和来源?

VisionTagger 支持常见图片格式,如 JPEG、PNG、TIFF、HEIC 和 WebP,以及包括 DNG 在内的多种 RAW 格式。你可以从 Mac 上的文件夹选择图片,或直接从你的 Photos Library 选择。

可以调整描述的详细程度吗?

可以。你可以在三个级别中选择:简洁生成一句话,适合用作 alt 文本;标准生成两句带上下文的描述,适合用作图片说明;详细则生成全面的描述。

可以控制生成哪些关键词吗?

可以。你可以设置关键词的最大数量,让模型为每张图片生成不超过该数量的关键词。你还可以定义始终添加在列表开头或末尾的关键词,以及指定要排除的关键词。生成后,你可以在导出前手动为每张图片重新排序、编辑、添加或删除关键词。

可以自定义元数据字段吗?

可以。除了内置分区(标题、描述、关键词、内容与风格、安全与合规)之外,你还可以创建自定义分区并添加自己的字段。每个字段都支持数据类型(Boolean、Text 或 List of Texts)以及独立的提示词,让你能精确控制模型要提取的内容。

导出与集成

VisionTagger 能写回我的 Photos Library 吗?

可以。当你选择该输出选项时,VisionTagger 可以把元数据写回你的 Photos Library。写入之前你总会看到发布摘要。

VisionTagger 能生成哪些输出?

VisionTagger 可以为每张图片导出 JSON、CSV 或 TXT,也可以为整批图片导出单个 JSON/CSV/TXT 文件。它还可以应用 Finder 标签。对于 XMP sidecar 和将元数据嵌入图片文件,VisionTagger 会集成 ExifTool(需另行安装)。

VisionTagger 可以输出英语以外的其他语言的元数据吗?

可以。VisionTagger 始终以英语生成元数据,以确保最佳的 AI 模型质量。当你在设置中选择其他输出语言时,生成的元数据会使用 macOS 内置翻译功能自动翻译。支持的语言包括阿拉伯语、中文、荷兰语、法语、德语、印地语、印度尼西亚语、意大利语、日语、韩语、波兰语、葡萄牙语、俄语、西班牙语、泰语、土耳其语、乌克兰语和越南语。翻译可用前需要先在系统设置中下载语言包。

我需要安装 ExifTool 吗?

ExifTool 只在生成 XMP sidecar 和将元数据嵌入图片文件时需要。如果你只导出 JSON/CSV/TXT 或应用 Finder 标签,就不需要 ExifTool。

VisionTagger 会覆盖已有文件或元数据吗?

VisionTagger 在写入任何输出前都会显示发布摘要,并在可能覆盖已有文件时提醒你。你可以先检查将要执行的操作,并在保存前确认。

系统要求

需要进行技术配置吗?

不需要。一键下载模型即可开始处理。VisionTagger 预设了合理的默认值。如果你想要更多控制,可以在设置中调整输出长度等参数——但大多数用户无需调整。

VisionTagger 需要联网吗?

VisionTagger 在本地运行,不会上传你的图片或生成的元数据。只有在应用内下载模型,以及检查并下载应用更新时才需要联网。

速度怎么样,我需要什么 Mac?

VisionTagger 需要 Apple Silicon(M1 或更新机型),并在 macOS Tahoe 26.0 或更高版本上运行。建议至少 16 GB 内存;使用较大模型时,推荐 32 GB 或更多。速度取决于你的 Mac、所选模型、图片分辨率以及你选择的元数据字段。较小的模型通常更快;较大的模型可能产出更高质量结果。

模型会占用多少磁盘空间?

模型下载会保存在本地。每个模型大约需要 4–8 GB(因模型而异)。

自动化

我可以自动化 VisionTagger 吗?

可以。VisionTagger 通过两个操作与 Apple 快捷指令集成:Generate Image Metadata(用于 Finder 中的文件)和 Generate Photo Metadata(用于你的 Photos Library)。两者都能在后台运行完整流程,并将结果导出到你配置的目的地。你可以在快捷指令 App、Finder 快速操作、文件夹自动化、命令行和 AppleScript 中使用它们。你还可以提供从应用导出的设置预设,以实现可复现的自动化。

AI 模型

内置了哪些视觉模型?

VisionTagger 内置了六个预配置的视觉模型:Qwen3-VL 8B Instruct、Qwen3-VL 30B-A3B Instruct、Qwen2.5-VL 7B Instruct、Gemma 3 4B IT、InternVL3 8B Instruct 和 Pixtral 12B。较小的模型通常运行更快;较大的模型可能输出更高细节,但会根据你的 Mac 和所选设置需要更多内存。你可以用试用版对比模型并调整参数,直到结果符合你的工作流和偏好的细节程度。

我可以使用自己的模型吗?

可以。如果你有兼容 GGUF 的视觉模型及其匹配的 projector 文件(同样是 GGUF),就能在 VisionTagger 里把它们链接起来,像内置选项一样使用。你需要自行确保对第三方模型的使用符合它们的许可与条款。

可以调模型参数吗?

可以。在设置里你可以用滑块调整 temperature、max tokens、context length、top-P 和 top-K 等生成参数。这能帮助你在创意和一致性之间做平衡,并控制输出长度与细节。

隐私

VisionTagger 和云端关键词服务相比如何?

大多数云端关键词服务按张收费,且需要将照片上传到他们的服务器。VisionTagger 一次购买,无按张收费——你可以处理任意数量的图片。你的照片永远不会离开你的 Mac,元数据直接写入 XMP sidecar 和文件,而不是需要手动导入的 CSV 导出。

GPS Location 功能会将我的数据发送到哪里吗?

图片中嵌入的 GPS 坐标会匿名发送至 Apple 地图以查询地名。仅发送坐标——Apple 不会收集与您的地图使用相关的个人数据。GPS Location 功能在应用中默认处于关闭状态。

翻译功能会向 Apple 发送数据吗?

默认情况下,macOS 可能会使用 Apple 的在线翻译服务以提高准确性。要确保所有翻译完全在 Mac 上完成,不让数据离开设备,请在系统设置 > 翻译 中启用“设备端模式”。

VisionTagger 会收集使用数据或分析信息吗?

不会。VisionTagger 不包含 analytics 或遥测,也不会上传你的数据。许可激活与更新检查会在这些功能需要时发起网络请求。