Closed5

Qwen3-VL-30B-A3Bを試す(AWQ)

kun432kun432

https://x.com/Alibaba_Qwen/status/1974289216113947039

🚀 Qwen3-VL-30B-A3B-Instruct & Thinkingが登場!
より小さなサイズで、同じ強力なパフォーマンス 💪— Qwen3-VLのすべての機能を搭載!

🔧 わずか30億のアクティブパラメータで、GPT-5-MiniやClaude4-Sonnetに匹敵し、STEM、VQA、OCR、ビデオ、エージェントタスクなどでしばしばそれらを上回ります。

それだけではありません:FP8バージョンもリリースし、さらに巨大なQwen3-VL-235B-A22BのFP8も公開!

ぜひ試して、マルチモーダルAIアプリケーションをより高速に実行してください!🧠🖼️

Qwen Chat: https://chat.qwen.ai/?models=qwen3-vl-30b-a3b
Github&Cookbooks: https://github.com/QwenLM/Qwen3-VL/blob/main/cookbooks
API: https://alibabacloud.com/help/en/model-studio/models#5540e6e52e1xx
Blog: https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list
ModelScope: https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b
HuggingFace: https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

https://x.com/Alibaba_Qwen/status/1974289216113947039

Qwen3-VL-30B-A3B-Thinkingの性能


VRAM 24GBだとさすがに量子化なしだと厳しいかなーと思ってたんだけど、AWQ版があった。

https://huggingface.co/QuantTrio/Qwen3-VL-30B-A3B-Instruct-AWQ

https://huggingface.co/QuantTrio/Qwen3-VL-30B-A3B-Thinking-AWQ

kun432kun432

InstructモデルをUbunt-22.04+RTX4090(VRAM 24GB)で試す。

mkdir qwen3-vl-awq && cd $_
uv venv -p 3.12 --seed
uv pip install -U vllm \
    --torch-backend=auto \
    --extra-index-url https://wheels.vllm.ai/nightly

起動。オプションは色々試行錯誤。

uv run vllm serve \
    QuantTrio/Qwen3-VL-30B-A3B-Instruct-AWQ \
    --dtype half \
    --gpu-memory-utilization 0.9 \
    --kv-cache-dtype fp8 \
    --max-model-len 16384 \
    --max-num-seqs 1 \
    --host 0.0.0.0 \
    --port 8000

サンプルとして自分の手持ちの画像を使う。

curl http://<サーバのIPアドレス>:8000/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "QuantTrio/Qwen3-VL-30B-A3B-Instruct-AWQ",
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": "この画像について詳しく説明して。"
                    },
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": "https://storage.googleapis.com/zenn-user-upload/82968d23b6c5-20250228.jpg"
                        }
                    }
                ]
            }
        ]
    }' | jq -r .choices[0].message.content

結果

出力
この画像は、日本・兵庫県の神戸市にある「神戸ポートタワー」(通称:神戸ポートタワー)とその周辺の風景を捉えたものです。以下に詳細に説明します。

---

### 1. **主要な建造物**
- **神戸ポートタワー (Kobe Port Tower)**
  - 画像の中央にそびえ立つ、赤と白の縞模様が特徴的な高さ約108メートルの鉄塔です。
  - 1961年(昭和36年)に開業し、神戸港の象徴的な存在です。
  - レストランや展望台が設けられており、神戸港の全景を一望できます。

- **神戸海洋博物館 (Kobe Maritime Museum)**
  - 神戸ポートタワーの右隣に位置する、白い帆のようなデザインが特徴的な建物です。
  - 1995年の阪神・淡路大震災の復興の象徴として、2001年(平成13年)に開館しました。
  - 開館後、2023年(令和5年)に閉館し、その後の再開発が進められています。

---

### 2. **周辺の風景**
- **神戸港の港湾施設**
  - 前景には、港の桟橋やフェリーターミナルが見えます。
  - 画像の左側には、白い船が停泊しており、観光客向けのフェリーが運航されている様子がうかがえます。

- **背景の山々**
  - 遠くの背景には、神戸市を囲む山々が見え、自然と都市の調和が感じられます。

- **青空と海**
  - 天気は晴れで、青空が広がり、海面には建物の反射が映っています。
  - 光線は明るく、日中の穏やかな雰囲気が漂っています。

---

### 3. **全体的な印象**
- 画像は、神戸港の中心部から見た風景で、都市の近代的な建築と自然の風景が調和しています。
- 神戸ポートタワーは、神戸の象徴的なランドマークであり、港町としての歴史と現代の発展が感じられる場所です。

---

### 4. **補足情報**
- 神戸ポートタワーは、1960年代の神戸港の再開発事業の一環として建設されました。
- 1995年の阪神・淡路大震災では、タワーの一部が損壊しましたが、復旧工事の後、再び観光の拠点となっています。

---

この画像は、神戸の港町の魅力と、その象徴的存在である神戸ポートタワーの姿を、明るく穏やかな日差しの下で捉えています。

ダミーの請求書画像。プロンプトは上と同じ。

出力
もちろん、この画像について詳しく説明します。

これは日本語で作成された「御請求書」(ごせいきゅうしょ)です。請求書は、商品やサービスの提供に対して金銭の支払いを求める正式な書類です。以下に、画像の内容を詳細に解説します。

---

### 1. 基本情報
- **書類の種類**: 御請求書 (ごせいきゅうしょ)
- **請求書番号**: INV-2024-0820
- **発行元**: 模範商事株式会社
- **発行先**: 範例工業株式会社 御中 (「御中」は「御社」の略で、相手先の会社名を指す)
- **発行日**: 画像には明記されていませんが、請求書番号の「2024」から2024年であることがわかります。

---

### 2. 発行元の詳細
- **会社名**: 模範商事株式会社
- **住所**: 〒100-0001 東京都千代田区見本町1-1
- **電話番号**: 03-1234-5678
- **FAX番号**: 03-1234-5679
- **印鑑**: 右上に「之印」と記された赤い印鑑が押されています。

---

### 3. 請求内容 (商品一覧)
請求書には3つの商品が記載されており、それぞれの数量、単価、金額が明記されています。

| 項目 | 数量 | 単価 | 金額 |
| :--- | :--- | :--- | :--- |
| 特選和紙 (A4サイズ) | 1000 | ¥50 | ¥50,000 |
| 高級墨 (松煙) | 20 | ¥2,000 | ¥40,000 |
| 筆セット (各種) | 50 | ¥1,000 | ¥50,000 |

---

### 4. 金額の合計
- **小計 (合計金額)**: ¥140,000
- **消費税 (10%)**: ¥14,000
- **合計金額**: ¥154,000

合計金額は、小計に消費税を加えたものです。`¥140,000 + ¥14,000 = ¥154,000` という計算が正しいです。

---

### 5. 備考
請求書の下部には、以下の3つの備考事項が記載されています。

1. **お支払いは請求書発行日より30日以内にお願いいたします。**
   - これは「支払い期限」を示しており、発行日から30日以内に支払いを済ませる必要があります。

2. **振込手数料は貴社負担でお願いいたします。**
   - 支払い方法が振込(銀行送金)であることを示唆しています。その際、送金側(相手)が支払う手数料は、相手先(この場合、範例工業株式会社)が負担するという条件です。

3. **本書に関するお問い合わせは下記担当者までご連絡ください。**
   - お問い合わせ先の担当者を明記しています。

---

### 6. 担当者
- **担当**: 営業部 見本太郎
- これは、この取引の担当者(営業担当者)の名前です。お問い合わせの際にはこの人を指名する必要があります。

---

### まとめ
この画像は、**模範商事株式会社**が**範例工業株式会社**に対して、和紙、墨、筆セットなどの文房具を販売した際の請求書です。合計金額は**154,000円**(消費税込み)で、支払い期限は発行日から30日以内です。この書類は、会計処理や会社の経理部門で使用される正式な書類です。
kun432kun432

Thinkingモデルも。

uv run vllm serve \
    QuantTrio/Qwen3-VL-30B-A3B-Thinking-AWQ \
    --dtype half \
    --gpu-memory-utilization 0.9 \
    --kv-cache-dtype fp8 \
    --max-model-len 16384 \
    --max-num-seqs 1 \
    --host 0.0.0.0 \
    --port 8000

1つ上と全く同じプロンプトでリクエストを送る。

まず、神戸の風景画像。

出力
用户现在需要详细描述这张图片。首先看画面主体:前景是蓝色的水面,有波纹,反射出周围建筑。中间是港口区域,码头设施,有停靠的船。然后背景建筑:最显眼的是红色的神户港塔(Kobe Port Tower),红色钢架结构,顶部有天线。旁边有现代高层建筑,比如右侧的白色高楼(可能神户站附近?),还有独特的白色网状结构建筑(可能是神户临海乐园的建筑,比如美利坚公园附近的设施)。远处有山脉,天空晴朗,蓝天无云,光线明亮,说明是晴天。

先确认地标:神户港塔是日本神户的著名地标,红色,高耸。画面中的建筑群属于神户港临海区域,包括港湾、码头、商业建筑。水面是神户港的港口,右侧有一艘白色的游轮或观光船。

现在分解元素:

1. 水面:深蓝色,有波纹,反射建筑,说明是港口水域,可能是神户港的港湾。
2. 港口设施:左侧有码头,有遮阳棚和停靠的船只(比如小型客船),码头的结构是混凝土或钢结构。
3. 建筑物:
   - 红色塔:神户港塔(Kobe Port Tower),红白相间?不,这里是红色的钢架结构,顶部是红色,底部可能有白色。神户港塔是日本最著名的红色铁塔,高108米,建于1963年,用于港口导航等。
   - 左侧白色建筑:可能是神户临海乐园(Kobe Harborland)的商业设施,比如Kobe Harborland的建筑,现代风格,白色,多层。
   - 右侧白色网状建筑:可能是神户临海乐园的“神户艺术广场”或者旁边的建筑,比如“神户海洋博物馆”附近?或者是神户港的其他设施,比如“Kobe Port Tower”附近的建筑,还有右侧的白色建筑群,包括高楼。
   - 远处的山:神户周边的山峦,比如六甲山,远处的山地。
4. 天气:晴朗,蓝天,说明是好天气,光线充足,建筑和水面的倒影清晰。

现在组织语言:

这张图片展示的是日本神户市的港口区域,标志性建筑是**神户港塔(Kobe Port Tower)**,它以鲜艳的红色钢架结构矗立在画面中央,是神户的著名地标。塔身呈独特的倾斜设计,顶部为红色,底部有白色装饰,塔顶还设有导航设备。

画面前景是**神户港的水面**,水色深蓝,波光粼粼,清晰地倒映出港口建筑和蓝天,显示出天气晴朗、光线充足。水面右侧有一艘白色的游轮或观光船停靠在码头。

港口区域的建筑群风格现代,左侧可见一座**白色现代建筑**(可能是神户临海乐园的商业设施,如“Kobe Harborland”区域的建筑),建筑线条简洁,多层结构,外立面以白色为主,带有大面积玻璃窗。

右侧还有**高层建筑**(如神户站附近的写字楼)和一座**白色网状结构的建筑**(可能是神户临海乐园的特色建筑,如“神户海洋博物馆”或“神户艺术广场”附近的设施,其独特的网状设计极具现代感)。

背景中,远处的**山峦**(神户周边的六甲山等)在晴朗天空下轮廓分明,天空呈现清澈的淡蓝色,几乎没有云层,整体氛围明亮而开阔。

整个场景体现了神户作为港口城市的特点:港口设施完善,现代建筑与自然景观(山峦)相映成趣,红色港塔成为视觉焦点,展现出神户既充满活力又兼具自然美感的城市风貌。

需要确认细节:神户港塔确实是红色,是日本唯一红色的铁塔,建于1963年,用于港口导航,现在是观光景点。神户临海乐园(Harborland)是神户港的重要区域,有商业、娱乐设施。画面中的白色网状建筑可能是“神户海洋博物馆”附近的建筑,或者是“神户站”周边的现代建筑群。

再检查元素:水面、码头、船只、红色塔、现代建筑、远处山峦、蓝天。这些元素组合起来,明确是神户港的标志性景观,尤其是神户港塔,所以描述时要突出地标。
</think>

この画像は**日本神戸市の港湾エリア**を捉えたもので、神戸の象徴的なランドマークと都市景観が特徴です。以下に詳細に説明します。

### 1. メインのランドマーク:神戸港タワー
画面中央にそびえる**赤い鉄骨構造の塔**は、**神戸港タワー(Kobe Port Tower)**です。これは神戸で最も有名な赤い鉄塔で、1963年に建設され、港湾の航法標としての機能を有するだけでなく、観光スポットとしても知られています。塔身は傾斜したデザインで、上部は赤く、底部は白い装飾が施され、頂上には導航用の機器が設置されています。塔の赤い色が青空と対比し、視覚的に非常に目立つのが特徴です。

### 2. 港湾と水面
画像の下部を占める**神戸港の水面**は、深みのある青色で波紋を含み、周囲の建物や空の様子をはっきりと映し出しています。右側には**白い遊覧船**が停泊しており、港の活気を伝えています。左側には**桟橋**があり、その上には屋根付きの待合スペースや乗り降りするための施設が整備されています。

### 3. 現代的な都市景観
港湾周辺には、**モダンな建築物**が密集しています。
- 左側の**白い多層建物**は、神戸臨海パーク(Kobe Harborland)の商業施設やオフィスビルの一部である可能性が高いです。外観はクリーンで現代的で、大規模な窓面や曲線を用いたデザインが特徴です。
- 右側には**高層ビル**や、**白い網状の構造を持つ建築**(神戸海洋博物館や神戸芸術館周辺の施設を連想させるデザイン)が見え、神戸の近代的な都市像を表現しています。

### 4. 背景の自然環境
遠くには**山々**が広がり、神戸の地勢を反映した風景です。山の緑と青空が調和し、港湾の人工的で洗練された景観と自然の穏やかさが対比されています。

### 5. 天候と雰囲気
空は**澄んだ青色**で、雲はほとんどなく、晴れた日の明るい光線が全体に満ちています。この良好な天候により、建物のディテールや水面の反射がはっきりと捉えられており、活気ある港湾の姿が鮮明に表現されています。

### まとめ
この画像は、**神戸港タワー**を核として、港湾施設、現代建築、自然の山々が調和した「港湾都市の魅力」を示しています。神戸港タワーの赤い姿が視覚的なアクセントとなり、その周囲のモダンな建物や清澄な水面が、神戸の「近代的で開放的な港町」というイメージを強調しています。神戸臨海パークや神戸の港湾施設の典型的な風景であり、観光地としても知られるこのエリアの魅力を凝縮した一枚です。

Reasoningの日本語訳

Reasoning日本語訳
ユーザーは現在、この画像の詳細な説明を必要としています。まず画面の主体から見ていきましょう:前景は青い水面であり、波紋が周囲の建物を映し出しています。中間には港湾エリアと埠頭施設、停泊中の船があります。次に背景の建物:最も目立つのは赤い神戸ポートタワー(Kobe Port Tower)で、赤い鉄骨構造の頂部にアンテナが設置されています。その傍らには現代的な高層ビル群が立ち並び、右側には白い高層ビル(神戸駅付近か?)や、独特の白い網目構造の建物(神戸臨海遊園地の施設、例えばアメリカンパーク周辺の施設か)が見えます。遠くには山脈が連なり、空は晴れ渡り、雲ひとつない青空に明るい光が差し込んでおり、晴天であることを示しています。

まずランドマークを確認:神戸ポートタワーは日本の神戸を代表する赤くそびえるランドマーク。画面内の建築群は神戸港臨海エリアに属し、港湾・埠頭・商業ビルを含む。水面は神戸港の港湾で、右側に白いクルーズ船または観光船が浮かんでいる。

要素を分解:

1. 水面:濃い青色で波紋があり、建築物を反射していることから、港湾水域(おそらく神戸港の湾内)と推測される。
2. 港湾施設:左側に埠頭があり、日除けと係留船(小型旅客船など)が見える。埠頭の構造はコンクリートまたは鋼構造。
3. 建物:
   - 赤い塔:神戸ポートタワー(Kobe Port Tower)。赤と白の配色?いや、ここは赤い鉄骨構造で、上部が赤、下部は白かもしれない。神戸ポートタワーは日本で最も有名な赤い鉄塔で、高さ108メートル、1963年に建設され、港湾航行などのために使用されている。
   - 左側の白い建物:神戸ハーバーランドの商業施設(例:ハーバーランドビル)の可能性。モダンなスタイルで、白く、多層構造。
   - 右側の白い網目状の建物:神戸ハーバーランド内の「神戸アートプラザ」か、その隣接施設(例:「神戸海洋博物館」付近?)あるいは神戸港の他の施設(例:「神戸ポートタワー」周辺建築物)の可能性。右側の白い建築群には高層ビルも含まれる。
   - 遠方の山:神戸周辺の山々(例:六甲山)や遠方の山地。
4. 天候:晴天、青空。好天を示し、光量が豊富で、建築物と水面の反射が鮮明。

画像説明:

この写真は神戸市の港湾エリアを捉えたもので、象徴的な建造物である**神戸ポートタワー(Kobe Port Tower)**が鮮やかな赤色の鉄骨構造で画面中央に聳え立ち、神戸の有名なランドマークとなっている。塔体は独特の傾斜デザインで、頂部は赤、底部には白の装飾が施され、塔頂部には航法装置が設置されている。

画面前景は**神戸港の水面**。水色は深い青で、きらきらと光り、港の建築物と青空をはっきりと映し出しており、晴天で光が十分であることを示している。水面右側には白いクルーズ船または観光船が埠頭に停泊している。

港湾エリアの建築群はモダンな様式で、左側には**白い現代建築**(神戸臨海ランドの商業施設、例えば「Kobe Harborland」エリアの建物と思われる)が見える。建築ラインはシンプルで多層構造、外壁は白を基調とし、大きなガラス窓が特徴的である。

右側には**高層ビル**(神戸駅周辺のオフィスビルなど)と**白い網目構造の建物**(神戸臨海ランドの特徴的な建築物、例えば「神戸海洋博物館」や「神戸アートプラザ」周辺の施設で、その独特の網目デザインが非常にモダンな印象を与える)も見られる。

背景には、遠くの**山々**(神戸周辺の六甲山など)が晴天の下でくっきりと輪郭を描き、空は澄んだ淡い青色で雲がほとんどなく、全体的に明るく開放的な雰囲気を醸し出している。

この情景は港湾都市・神戸の特徴を体現している:港湾施設が整備され、現代建築と自然景観(山々)が調和し、赤い港塔が視覚的焦点となることで、活力に満ちつつ自然美を兼ね備えた神戸の都市景観が表現されている。

詳細確認事項:神戸ポートタワーは確かに赤色で、日本で唯一の赤い鉄塔。1963年に港湾航路標識として建設され、現在は観光名所。神戸ハーバーランドは神戸港の重要エリアで商業・娯楽施設が集積。画面内の白い網目状の建築物は「神戸海洋博物館」付近の建物か、「神戸駅」周辺の近代建築群の可能性あり。

要素の再確認:水面、埠頭、船舶、赤いタワー、現代建築、遠方の山々、青空。これらの要素が組み合わさることで、神戸港の象徴的な景観、特に神戸ポートタワーが明確に浮かび上がる。したがって、ランドマークを強調した描写が必要である。

ダミーの請求書画像

出力
用户现在需要详细描述这张图片里的请求书内容。首先看整体是日本的请求书(御請求書),属于商务文件。

先看标题部分:“御請求書”是请求书,请求书番号是INV-2024-0820。然后是开具方“模範商事株式会社”,有红色的“之印”印章,说明是公司盖章。地址是〒100-0001 东京都千代田区丸之内1-1,电话和传真号码。

接下来是收件方“範囲工業株式会社”(这里可能是“範囲工業株式会社”?看文字是“範囲工業株式会社”),然后是“御中”表示给对方公司相关部门。下面写“下記の通りご請求申し上げます。”意思是按下面内容请求。

然后是表格部分,项目、数量、単価(单价)、金額(金额)。第一个项目是“待避紙(A4サイズ)”(待避纸,A4尺寸),数量1000,单价50円,金额50000円。第二个是“高級黒(松煙)”(高级黑,松烟墨?),数量20,单价2000円,金额40000円。第三个是“筆セット(各種)”(笔套装,各种),数量50,单价1000円,金额50000円。

然后小计140000円,消费税10%是14000円,合计金额154000円。

備考(备注)部分:1. お支払いは請求書発行日より30日以内お願いいたします。(请在请求书开具日后30天内支付)2. 振込手数料は貴社負担でお願いいたします。(汇款手续费由贵公司承担)3. 本書に関するお問い合わせは下記担当者までご連絡ください。(关于本文件的咨询请联系下记负责人)担当是営業部見本太郎(营业部见本太郎)。

还要检查细节:印章是“之印”,表示公司盖章;地址邮编是100-0001,东京都千代田区丸之内1-1;电话和传真;表格里的金额计算是否正确,小计140000,消费税10%是14000,合计154000。

另外,注意“範囲工業株式会社”可能是“範囲工業株式会社”,但用户提供的图片里是“範囲工業株式会社”?看图片文字:“範囲工業株式会社 御中”——这里应该是“範囲工業株式会社”是请求对象。

现在整理结构:

1. 文件类型:御請求書(请求书/发票)
2. 请求书编号:INV-2024-0820
3. 发出公司:模範商事株式会社,地址、电话、传真,有红色印章“之印”
4. 收件方:範囲工業株式会社(御中表示给该公司的相关部门)
5. 内容:列出了三个项目,各项目数量、单价、金额
6. 金额计算:小计140,000円,消费税10%为14,000円,合计154,000円
7. 备注:支付期限、手续费承担、咨询联系人

需要确认每个部分的细节,比如“待避紙(A4サイズ)”是A4纸的待避纸,可能用于临时存储或待处理的纸张;“高級黒(松煙)”可能是指松烟墨,用于书法等;“筆セット(各種)”是各种笔套装。

还要注意文字的准确性,比如“範囲工業株式会社”可能是“範囲工業株式会社”(可能输入错误,但按图片文字)。

现在组织语言,详细说明每个部分,包括标题、编号、公司信息、表格内容、金额计算、备注等。
</think>

这张图片展示的是一份**日本商务请求书(御請求書)**,属于企业间的财务往来文件,用于向客户请求付款。以下是详细内容解析:


### 1. 文件基本信息
- **标题**:「御請求書」(请求书/发票),表明文件性质是商业付款请求。
- **请求书番号**:`請求書番号: INV-2024-0820`(编号格式为“INV-年份-序号”,此处为2024年8月20日的请求书)。


### 2. 发出方信息(模範商事株式会社)
- **公司名称**:模範商事株式会社
- **地址**:〒100-0001 东京都千代田区丸之内1-1(邮编100-0001,对应东京都核心区域丸之内)。
- **联系方式**:
  - 電話(电话):03-1234-5678
  - FAX(传真):03-1234-5679
- **印章**:右上角有红色圆形印章「之印」,表示公司盖章(日本企业文件需盖章以确认真实性)。


### 3. 收件方信息
- **公司名称**:範囲工業株式会社(“御中”表示该文件针对该公司内部相关部门,非个人)。
- **目的**:「下記の通りご請求申し上げます。」(按以下内容提出请求)。


### 4. 项目明细表(数量、单价、金额)
表格列出了3项商品/服务的请求金额:

| 項目 | 数量 | 単価(单价) | 金額(金额) |
|------|------|--------------|--------------|
| 待避紙(A4サイズ) | 1,000 | ¥50 | ¥50,000 |
| 高級黒(松煙) | 20 | ¥2,000 | ¥40,000 |
| 筆セット(各種) | 50 | ¥1,000 | ¥50,000 |

- **项目解释**:
  - 「待避紙(A4サイズ)」:A4尺寸的待避纸(可能用于临时存储/待处理的纸张,常见于工业场景)。
  - 「高級黒(松煙)」:松烟墨(高级黑色墨水,常用于书法、印刷等)。
  - 「筆セット(各種)」:各类笔套装(“各種”表示多种款式)。


### 5. 金额汇总
- **小計**:¥140,000(3项金额总和:50,000 + 40,000 + 50,000 = 140,000)
- **消費税(10%)**:¥14,000(140,000 × 10%)
- **合計金額**:¥154,000(140,000 + 14,000)


### 6. 備考(备注)
- 1. お支払いは請求書発行日より30日以内お願いいたします。(请在请求书开具日后30天内支付。)
- 2. 振込手数料は貴社負担でお願いいたします。(汇款手续费由贵公司承担。)
- 3. 本書に関するお問い合わせは下記担当者までご連絡ください。(关于本文件的咨询,请联系下记负责人。)
- **担当者**:営業部 見本太郎(营业部见本太郎)


### 7. 文档风格与用途
- 文件采用日式商务格式,结构严谨,包含**公司信息、项目明细、金额计算、支付规则**,是日本企业间典型的“付款请求单”(类似发票/对账单)。
- 红色印章(之印)和“御中”等日语商务术语,体现了日本商业文件的规范性与礼仪性。


这份文件的核心目的是**向範囲工業株式会社请求支付154,000円**,并明确支付期限、手续费承担规则等商务条款。

んー、こちらはReasoningだけでなく回答も中国語になってしまった。少し前に他のVLMを試していたときにも感じたのだけど、Reasoning対応VLMをOCR的に使うと、Reasoningトークンで使用されている言語に引っ張られて、結果も間違ってしまうようなことがチラホラ起きるような印象がある。

プロンプトに明示的に日本語指示を追加して再度実施。

        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": "この画像について詳しく説明して。説明は日本語で。"
                    },
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": "https://storage.googleapis.com/zenn-user-upload/4697c3aef653-20250226.png"
                        }
                    }
                ]
          }
出力
用户现在需要详细描述这张图片里的请求书内容,要用日本语。首先得仔细看图片里的各个元素:标题、编号、公司信息、表格、金额、备注等。

首先,标题是“御請求書”(請求書),然后是請求書番号(INV-2024-0820)。接下来是対象会社(模範商事株式会社),地址电话这些。然后是下記の通りご請求します,下面表格有项目、数量、単価、金額。项目有两个:特選和紙(A4サイズ)1000枚、50円,金额50000日元;高級墨(松煙)20個、2000円,金额40000日元。小計140000,消費税10%是14000,合計154000。備考部分有支付期限、振込手数料、問い合わせ先。担当是営業部見本太郎。

现在要组织语言,按顺序说明。先整体是請求書(請求書),然后各部分:

1. 顶部标题“御請求書”,番号INV-2024-0820。
2. 請求先の会社名:模範商事株式会社,住所、電話、FAX。
3. 被請求先:範囲工業株式会社 御中。
4. 表格内容:項目、数量、単価、金額。两个项目,计算小計、消費税、合計。
5. 備考:支払期限、振込手数料、問い合わせ先。
6. 担当者:営業部見本太郎。

需要确认每个细节,比如“之印”是公司印章,地址是〒100-0001 東京都千代田区見本町1-1,电话03-1234-5678,FAX 03-1234-5679。表格里的内容:特選和紙A4サイズ数量1000,単価50円,金额50000;高級墨松煙数量20,単価2000円,金额40000。小計140000,消費税10%即14000,合計154000。

備考部分:“お支払いは請求書発行日より30日以内お願いいたします。”(支付期限30天内);“振込手数料は貴社負担でお願いいたします。”(振込手数料由贵公司承担);“本書に関するお問い合わせは下記担当者までご連絡ください。”(询问联系担当)。

担当者是営業部見本太郎。

现在把这些用日本语详细说明,分点或连贯叙述。

首先,这是一份請求書(請求書)。内容如下:

- 依頼先(請求先):模範商事株式会社
- 請求書番号:INV-2024-0820
- 住所:〒100-0001 東京都千代田区見本町1-1
- 電話:03-1234-5678
- FAX:03-1234-5679
- 申請先:範囲工業株式会社 御中

請求内容は以下の通り:
- 特選和紙(A4サイズ):数量1000枚、単価50円、金額50,000円
- 高級墨(松煙):数量20個、単価2,000円、金額40,000円

小計:140,000円
消費税(10%):14,000円
合計金額:154,000円

備考欄には以下のことが記載されています:
1. お支払いは請求書発行日より30日以内お願いいたします。
2. 振込手数料は貴社負担でお願いいたします。
3. 本書に関するお問い合わせは下記担当者までご連絡ください。

担当者:営業部 見本太郎

また、模範商事株式会社の「之印」(会社印)が右側に記載されています。

需要检查是否每个细节都覆盖,比如“之印”是公司印章,表格里的项目、数量、单价、金额,小計、消費税、合計,備考的三条,担当者。

现在组织成自然的日本语说明:

この画像は「御請求書」と題された書類であり、請求書番号は「INV-2024-0820」です。上部には「模範商事株式会社」の会社情報が記載されており、住所は「〒100-0001 東京都千代田区見本町1-1」、電話番号は「03-1234-5678」、FAX番号は「03-1234-5679」です。右側には「之印」と記された会社印が円形で表示されています。

下部の「範囲工業株式会社 御中」は請求の対象先を示しています。

中央には請求項目を表す表があり、以下のような内容です:
- 「特選和紙(A4サイズ)」:数量1000枚、単価50円、金額50,000円
- 「高級墨(松煙)」:数量20個、単価2,000円、金額40,000円

金額の合計は、小計として140,000円、消費税(10%)14,000円を加えた合計金額で154,000円となっています。

備考欄には以下の3点が記載されています:
1. お支払いは請求書発行日より30日以内お願いいたします。
2. 振込手数料は貴社負担でお願いいたします。
3. 本書に関するお問い合わせは下記担当者までご連絡ください。

担当者は「営業部 見本太郎」です。

全体的に、模範商事株式会社から範囲工業株式会社へ商品やサービスの請求を行う書類であり、各項目の数量、単価、金額が明確に記載され、支払い条件や連絡先も示されています。
</think>

この画像は「御請求書」と題された書類で、企業間の請求を記載した文書です。以下、詳細に説明します。

### 基本情報
- **書類の種類**:御請求書
- **請求書番号**:INV-2024-0820(上部中央に記載)
- **請求先の会社**:模範商事株式会社
  - **住所**:〒100-0001 東京都千代田区見本町1-1
  - **電話**:03-1234-5678
  - **FAX**:03-1234-5679
  - **会社印**:右側に「之印」と記された円形の印が表示(模範商事株式会社の公式印)

---

### 請求対象と内容
- **対象先**:範囲工業株式会社 御中(「御中」は「貴社」を表す敬称)
- **請求項目**:表形式で明確に記載され、以下の2項目が含まれる。

| 項目                     | 数量 | 単価   | 金額    |
|--------------------------|------|--------|---------|
| 特選和紙(A4サイズ)     | 1000 | ¥50    | ¥50,000 |
| 高級墨(松煙)           | 20   | ¥2,000 | ¥40,000 |

- **小計**:¥140,000
- **消費税(10%)**:¥14,000
- **合計金額**:¥154,000

---

### 備考欄の注意事項
下部の「備考」には、支払いや問い合わせに関する重要なルールが記載されています。
1. **支払い期限**:請求書発行日より30日以内にお支払いください。
2. **振込手数料**:貴社(範囲工業株式会社)の負担となります。
3. **問い合わせ先**:本書に関する質問は担当者までご連絡ください。

---

### 担当者情報
- **担当部署**:営業部
- **担当者**:見本太郎

---

### その他
- 画面全体は白地に斜めのグレーの線が入った背景で、請求書の正式性を強調するデザインです。
- 「模範商事株式会社」の企業情報、請求内容、支払い条件が一覧で整理され、誤りなく支払いが行われるよう配慮されています。

この請求書は、商品(和紙、墨)の販売を前提とした商業取引の請求書であり、金額や条件が明確に記載されていることが特徴です。

今度はOK、と思ったけど、表の認識がおかしいな。

kun432kun432

とても良い日本語文章を生成するし、日本語文字の認識も非常に優秀、と感じた。

今回試した限りだとThinkingである必要性は感じないかな、日本語で使う上では追加指示が必要そうだし、Reasoningトークンのせいでハルシネーションが起きそうな気がする。というかInstructで十分優秀だと思う。

kun432kun432

このクラスがGPU1枚で動くのはいいね。生成速度もこれぐらいは出てる。

出力
(APIServer pid=2378682) INFO 10-06 04:20:19 [loggers.py:128] Engine 000: Avg prompt throughput: 78.7 tokens/s, Avg generation throughput: 23.9 tokens/s, Running: 0 reqs, Waiting: 0 reqs, GPU KV cache usage: 0.0%, Prefix cache hit rate: 0.0%
このスクラップは6時間前にクローズされました