वेबजीपीयू और ऑन-डिवाइस एआई: ब्राउज़र एक गंभीर रनटाइम बनता जा रहा है

spinny:~/writing $ man webgpu-on-device-ai-browser

WEBGPU_ON_DEVICE_AI_BROWSER(7)spinny.devWEBGPU_ON_DEVICE_AI_BROWSER(7)

NAME

webgpu-on-device-ai-browser — वेबजीपीयू और ऑन-डिवाइस एआई: ब्राउज़र एक गंभीर रनटाइम बनता जा रहा है

SYNOPSIS

cat webgpu-on-device-ai-browser.md

DESCRIPTION

वर्षों तक ब्राउज़र एप्लिकेशन का अच्छा चेहरा था और क्लाउड वह स्थान था जहां कठिन चीजें घटित होती थीं। उपयोगकर्ता फ़ाइल लिखता है, क्लिक करता है, अपलोड करता है; फ्रंटएंड सब कुछ सर्वर को भेजता है; सर्वर एक मॉडल को कॉल करता है; उत्तर वापस आता है.

यह योजना बहुत उपयोगी है, लेकिन मुफ़्त नहीं है। प्रत्येक कॉल विलंबता, लागत, नेटवर्क निर्भरता और गोपनीयता प्रश्न लेकर आती है। यदि उपयोगकर्ता एक वाक्य लिख रहा है और एक सुझाव चाहता है, तो आधे सेकंड का वजन होता है। यदि आप हजारों छोटे इनपुटों को वर्गीकृत कर रहे हैं, तो पेनी वास्तविक धन बन जाते हैं। यदि पाठ संवेदनशील है, तो उसे डिवाइस से भेजना कोई तटस्थ विकल्प नहीं है।

इसीलिए WebGPU और ऑन-डिवाइस AI प्रचार में हैं। इसलिए नहीं कि हम कल हर मॉडल को ब्राउज़र में चलाएंगे। क्योंकि कुछ इंटेलिजेंट फीचर्स यूजर के करीब पहुंच सकते हैं।

जरूरी नहीं कि हर चीज स्थानीय हो जाए

तर्क का बचकाना संस्करण है: "क्लाउड बनाम डिवाइस"। उपयोगी संस्करण हाइब्रिड है.

कुछ कार्य डिवाइस पर बहुत अच्छे लगते हैं: संक्षिप्त सारांश, भाषा का पता लगाना, प्रकाश पुनर्लेखन, सरल वर्गीकरण, छवि फ़िल्टर, छोटे दृष्टि मॉडल, तत्काल प्रतिक्रिया के साथ रचनात्मक अनुभव।

अन्य कार्य क्लाउड में बेहतर रहते हैं: जटिल तर्क, फ्रंटियर मॉडल, सर्वर-साइड डेटा, केंद्रीकृत ऑडिट, समान गुणवत्ता, वर्कफ़्लो जहां आपको प्रत्येक चरण को सावधानीपूर्वक नियंत्रित करना होता है।

स्वस्थ आर्किटेक्चर रनटाइम पर निर्णय लेता है:

ब्राउज़र को क्लाउड के ख़िलाफ़ जीतना ज़रूरी नहीं है। इसे क्लाउड को वह काम करने से बचाना होगा जिसे वहां करने की आवश्यकता नहीं है।

WebGPU क्यों मायने रखता है

वेबजीपीयू ब्राउज़र से जीपीयू का उपयोग करने के लिए एक आधुनिक एपीआई है। यह सिर्फ अच्छे 3डी ग्राफ़िक्स के लिए नहीं है। यह इसलिए भी महत्वपूर्ण है क्योंकि यह कंप्यूटिंग के लिए उपयुक्त प्राइमेटिव्स को उजागर करता है: समानांतर वर्कलोड, शेडर्स, जीपीयू जो अच्छा करता है उसके करीब पाइपलाइन।

एआई, वैज्ञानिक विज़ुअलाइज़ेशन, 3डी संपादकों, वीडियो फ़िल्टर और रचनात्मक टूल के लिए, यह अंतर महसूस किया जाता है। WebGL ने वेब के लिए बहुत कुछ किया है, लेकिन WebGPU का जन्म वर्तमान के लिए बेहतर मॉडल के साथ हुआ था।

हालाँकि, लिखने वाली पहली चीज़ शेडर नहीं है। यह एक शांत सुविधा पहचान है:

export async function requestWebGpuDevice() {
  if (!('gpu' in navigator)) {
    return null;
  }

  const adapter = await navigator.gpu.requestAdapter({
    powerPreference: 'high-performance',
  });

  if (!adapter) {
    return null;
  }

  return adapter.requestDevice();
}

यह सुविधा एक महत्वपूर्ण बात कहती है: वेबजीपीयू हर डिवाइस पर दिया गया अधिकार नहीं है। यह सत्यापित करने की क्षमता है। कुछ ब्राउज़र इसका पूरी तरह से समर्थन नहीं करते हैं, कुछ जीपीयू की सीमाएँ हैं, कुछ एंटरप्राइज़ वातावरण सुविधाओं को अक्षम कर देते हैं, कुछ उपयोगकर्ता मामूली हार्डवेयर पर हैं।

अंतर्निहित AI: जब ब्राउज़र मॉडल लाता है

क्रोम स्थानीय संकेतों, संक्षेपण, लेखन, पुनर्लेखन, अनुवाद, भाषा का पता लगाने और प्रूफरीडिंग जैसे कार्यों के लिए अंतर्निहित एपीआई पर जोर दे रहा है। यह विचार बहुत दिलचस्प है: ब्राउज़र मॉडल, उपलब्धता और अपडेट का प्रबंधन करता है; ऐप प्लेटफ़ॉर्म के करीब एक एपीआई का उपयोग करता है।

यदि यह अच्छा काम करता है, तो यह बहुत कुछ बदल देता है:

सरल कार्यों के लिए कम सर्वर कॉल;
डेटा जो डिवाइस पर रह सकता है;
कम विलंबता;
ऑफ़लाइन या अर्ध-ऑफ़लाइन अनुभव;
लेखन और अनुवाद के लिए अधिक प्राकृतिक UX।

लेकिन इसे प्रगतिशील वृद्धि के रूप में माना जाना चाहिए। कुछ एपीआई स्थिर हैं, अन्य मूल परीक्षण या पूर्वावलोकन में हैं, अन्य अभी भी संस्करण, भाषा और डिवाइस पर निर्भर हैं।

type LocalCapability = 'available' | 'downloadable' | 'unsupported';

export async function getLocalSummarizerCapability(): Promise<LocalCapability> {
  const SummarizerApi = (globalThis as any).Summarizer;

  if (!SummarizerApi?.availability) {
    return 'unsupported';
  }

  const availability = await SummarizerApi.availability();

  if (availability === 'available') return 'available';
  if (availability === 'downloadable') return 'downloadable';

  return 'unsupported';
}

विशिष्ट कोड बदल जाएगा, लेकिन पैटर्न बना रहेगा: आप उपलब्धता की जांच करते हैं, किसी भी डाउनलोड की व्याख्या करते हैं, फ़ॉलबैक की पेशकश करते हैं और गुणवत्ता मापते हैं।

फ़ॉलबैक कोई दुखद योजना बी नहीं है

बादलों का गिरना कोई हार नहीं है. यह उत्पाद का हिस्सा है.

interface AiRequest {
  task: 'summarize' | 'rewrite' | 'classify';
  input: string;
}

interface AiResult {
  output: string;
  runtime: 'local' | 'cloud';
}

export async function runAiTask(request: AiRequest): Promise<AiResult> {
  const local = await tryLocalAi(request);

  if (local) {
    return { output: local, runtime: 'local' };
  }

  const cloud = await fetch('/api/ai', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json' },
    body: JSON.stringify(request),
  }).then((res) => res.json());

  return { output: cloud.output, runtime: 'cloud' };
}

यह आर्किटेक्चर आपको उत्तरोत्तर सुधार करने की अनुमति देता है। स्थानीय समर्थन वाले लोगों को बेहतर विलंबता और गोपनीयता मिलती है। जिनके पास यह नहीं है वे अभी भी इस सुविधा का उपयोग करते हैं। आप स्थानीय अनुरोधों, समय, त्रुटियों, स्मृति, कथित गुणवत्ता और लागत का प्रतिशत माप सकते हैं।

मेट्रिक्स के बिना, ऑन-डिवाइस AI एक सौंदर्यवादी विकल्प बन जाता है। मेट्रिक्स के साथ, यह एक उत्पाद लीवर बन जाता है।

मॉडल का UX मायने रखता है

यदि ब्राउज़र को किसी मॉडल को डाउनलोड करने की आवश्यकता होती है, तो उपयोगकर्ता इसे समझ लेता है। इसे किसी अस्पष्ट स्पिनर के पीछे न छिपाएं। स्पष्ट होना बेहतर होगा: "हम इस फ़ंक्शन को तेज़ी से और ऑफ़लाइन भी उपयोग करने के लिए मॉडल तैयार करते हैं।"

एक अच्छा अनुभव:

तैयारी की स्थिति दिखाता है;
पूरे पेज को ब्लॉक नहीं करता;
आपको क्लाउड फ़ॉलबैक जारी रखने की अनुमति देता है;
बैटरी और मेमोरी आश्चर्य से बचें;
जब भी संभव हो मॉडल को याद रखें;
एक ठोस वाक्य में लाभ बताएं।

सबसे खराब चीज़ एक "स्मार्ट" सुविधा है जो टूटी हुई दिखाई देती है क्योंकि यह चुपचाप कुछ डाउनलोड कर रही है।

गोपनीयता: बेहतर, स्वचालित रूप से सुरक्षित नहीं

डिवाइस पर डेटा प्रोसेस करना एक बड़ा फायदा हो सकता है। ड्राफ्ट ईमेल, आंतरिक दस्तावेज़, या व्यक्तिगत नोट को सुझाव प्राप्त करने के लिए आपके ब्राउज़र को छोड़ने की आवश्यकता नहीं है।

हालाँकि, स्थानीय का मतलब स्वचालित रूप से सुरक्षित नहीं है। हालाँकि, आपको इस बारे में सोचने की ज़रूरत है:

एक्सएसएस;
आकस्मिक लॉग;
भंडारण में सहेजा गया डेटा;
अविश्वसनीय सामग्री से शीघ्र इंजेक्शन;
मॉडल को दी गई अनुमतियाँ;
स्वचालित क्रियाओं में उपयोग किए जाने वाले आउटपुट।

यदि कोई स्थानीय मॉडल किसी वेब पेज को पढ़ सकता है और फिर एक फॉर्म भर सकता है, तो वह पेज उसमें हेरफेर करने का प्रयास कर सकता है। यदि यह टूल को कॉल कर सकता है, तो पुष्टि की आवश्यकता है। यदि यह संरचित आउटपुट उत्पन्न करता है, तो इसे मान्य किया जाना चाहिए। तथ्य यह है कि यह डिवाइस पर चलता है, कुछ गोपनीयता जोखिमों को कम करता है, लेकिन सुरक्षा मॉडल को समाप्त नहीं करता है।

जहां यह वास्तव में दिलचस्प हो जाता है

पाठ तो बस शुरुआत है. WebGPU वेब अनुभवों को विश्वसनीय बनाता है जो हाल तक एक मूल ऐप की तरह लगता था:

जटिल 3डी संपादक;
ब्राउज़र में गॉसियन स्प्लैटिंग;
वास्तविक समय वीडियो फ़िल्टर;
हल्का सीएडी;
वैज्ञानिक दृश्यावलोकन;
तत्काल पूर्वावलोकन के साथ रचनात्मक उपकरण;
यूआई के निकट दृष्टि अनुमान;
अधिक महत्वाकांक्षी ब्राउज़र गेम।

यहां फ्रंटएंड, ग्राफिक्स और मशीन लर्निंग का मिश्रण शुरू होता है। यह कुछ हद तक अजीब क्षेत्र है, लेकिन उपजाऊ भी है: ब्राउज़र एक गंभीर एप्लिकेशन प्लेटफ़ॉर्म बन जाता है, न कि केवल वह स्थान जहां हम फॉर्म और डैशबोर्ड डालते हैं।

उत्पादन से पहले चेकलिस्ट

उपयोगकर्ताओं के सामने ऑन-डिवाइस सुविधा डालने से पहले, मैं जाँच करूँगा:

ब्राउज़र और डिवाइस को लक्षित करें.
बादल का गिरना या सुरुचिपूर्ण गिरावट।
डाउनलोड समय और मॉडल कैश.
औसत हार्डवेयर पर मेमोरी और बैटरी।
क्लाउड संस्करण की तुलना में गुणवत्ता।
गोपनीयता नीति और उपयोगकर्ता संदेश.
शत्रुतापूर्ण इनपुट के साथ परीक्षण.
स्थानीय और क्लाउड रनटाइम के लिए अलग-अलग मेट्रिक्स।
टेम्पलेट को अद्यतन या अक्षम करने की योजना बनाएं.

यह एक ठोस सूची है क्योंकि समस्या ठोस है। एक धीमी, नाजुक या अपारदर्शी एआई सुविधा सिर्फ ब्राउज़र में चलने से बेहतर नहीं हो जाती।

सही समझौता

मैं नहीं मानता कि भविष्य "डिवाइस पर सब कुछ" है। और मुझे नहीं लगता कि बादल अनुमान के लिए एकमात्र उचित स्थान रहेगा। सबसे संभावित भविष्य एक मिश्रण है: स्थानीय जब यह विलंबता, गोपनीयता या लागत में सुधार करता है; गुणवत्ता, अद्यतन डेटा और केंद्रीकृत नियंत्रण की आवश्यकता होने पर क्लाउड।

WebGPU, WebNN और अंतर्निहित AI API ब्राउज़र को सर्वशक्तिमान नहीं बनाते हैं। वे उसे और अधिक वयस्क बनाते हैं। और वेब उत्पाद बनाने वालों के लिए यह बहुत बड़ी खबर है।

उपयोगी स्रोत

METADATA

date: 2026-05-24
reading: 7 min
author: Filippo Spinella
tags: WebGPU, AI, Frontend, Web Performance

NAME

SYNOPSIS

cat webgpu-on-device-ai-browser.md

DESCRIPTION

जरूरी नहीं कि हर चीज स्थानीय हो जाए

तर्क का बचकाना संस्करण है: "क्लाउड बनाम डिवाइस"। उपयोगी संस्करण हाइब्रिड है.

स्वस्थ आर्किटेक्चर रनटाइम पर निर्णय लेता है:

WebGPU क्यों मायने रखता है

हालाँकि, लिखने वाली पहली चीज़ शेडर नहीं है। यह एक शांत सुविधा पहचान है:

export async function requestWebGpuDevice() {
  if (!('gpu' in navigator)) {
    return null;
  }

  const adapter = await navigator.gpu.requestAdapter({
    powerPreference: 'high-performance',
  });

  if (!adapter) {
    return null;
  }

  return adapter.requestDevice();
}

अंतर्निहित AI: जब ब्राउज़र मॉडल लाता है

यदि यह अच्छा काम करता है, तो यह बहुत कुछ बदल देता है:

सरल कार्यों के लिए कम सर्वर कॉल;
डेटा जो डिवाइस पर रह सकता है;
कम विलंबता;
ऑफ़लाइन या अर्ध-ऑफ़लाइन अनुभव;
लेखन और अनुवाद के लिए अधिक प्राकृतिक UX।

type LocalCapability = 'available' | 'downloadable' | 'unsupported';

export async function getLocalSummarizerCapability(): Promise<LocalCapability> {
  const SummarizerApi = (globalThis as any).Summarizer;

  if (!SummarizerApi?.availability) {
    return 'unsupported';
  }

  const availability = await SummarizerApi.availability();

  if (availability === 'available') return 'available';
  if (availability === 'downloadable') return 'downloadable';

  return 'unsupported';
}

फ़ॉलबैक कोई दुखद योजना बी नहीं है

बादलों का गिरना कोई हार नहीं है. यह उत्पाद का हिस्सा है.

interface AiRequest {
  task: 'summarize' | 'rewrite' | 'classify';
  input: string;
}

interface AiResult {
  output: string;
  runtime: 'local' | 'cloud';
}

export async function runAiTask(request: AiRequest): Promise<AiResult> {
  const local = await tryLocalAi(request);

  if (local) {
    return { output: local, runtime: 'local' };
  }

  const cloud = await fetch('/api/ai', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json' },
    body: JSON.stringify(request),
  }).then((res) => res.json());

  return { output: cloud.output, runtime: 'cloud' };
}

मॉडल का UX मायने रखता है

एक अच्छा अनुभव:

तैयारी की स्थिति दिखाता है;
पूरे पेज को ब्लॉक नहीं करता;
आपको क्लाउड फ़ॉलबैक जारी रखने की अनुमति देता है;
बैटरी और मेमोरी आश्चर्य से बचें;
जब भी संभव हो मॉडल को याद रखें;
एक ठोस वाक्य में लाभ बताएं।

गोपनीयता: बेहतर, स्वचालित रूप से सुरक्षित नहीं

एक्सएसएस;
आकस्मिक लॉग;
भंडारण में सहेजा गया डेटा;
अविश्वसनीय सामग्री से शीघ्र इंजेक्शन;
मॉडल को दी गई अनुमतियाँ;
स्वचालित क्रियाओं में उपयोग किए जाने वाले आउटपुट।

जहां यह वास्तव में दिलचस्प हो जाता है

जटिल 3डी संपादक;
ब्राउज़र में गॉसियन स्प्लैटिंग;
वास्तविक समय वीडियो फ़िल्टर;
हल्का सीएडी;
वैज्ञानिक दृश्यावलोकन;
तत्काल पूर्वावलोकन के साथ रचनात्मक उपकरण;
यूआई के निकट दृष्टि अनुमान;
अधिक महत्वाकांक्षी ब्राउज़र गेम।

उत्पादन से पहले चेकलिस्ट

उपयोगकर्ताओं के सामने ऑन-डिवाइस सुविधा डालने से पहले, मैं जाँच करूँगा:

ब्राउज़र और डिवाइस को लक्षित करें.
बादल का गिरना या सुरुचिपूर्ण गिरावट।
डाउनलोड समय और मॉडल कैश.
औसत हार्डवेयर पर मेमोरी और बैटरी।
क्लाउड संस्करण की तुलना में गुणवत्ता।
गोपनीयता नीति और उपयोगकर्ता संदेश.
शत्रुतापूर्ण इनपुट के साथ परीक्षण.
स्थानीय और क्लाउड रनटाइम के लिए अलग-अलग मेट्रिक्स।
टेम्पलेट को अद्यतन या अक्षम करने की योजना बनाएं.

सही समझौता

उपयोगी स्रोत

METADATA

date: 2026-05-24
reading: 7 min
author: Filippo Spinella
tags: WebGPU, AI, Frontend, Web Performance

NAME

SYNOPSIS

DESCRIPTION

जरूरी नहीं कि हर चीज स्थानीय हो जाए

WebGPU क्यों मायने रखता है

अंतर्निहित AI: जब ब्राउज़र मॉडल लाता है

फ़ॉलबैक कोई दुखद योजना बी नहीं है

मॉडल का UX मायने रखता है

गोपनीयता: बेहतर, स्वचालित रूप से सुरक्षित नहीं

जहां यह वास्तव में दिलचस्प हो जाता है

उत्पादन से पहले चेकलिस्ट

सही समझौता

उपयोगी स्रोत

METADATA

SEE ALSO

NAME

SYNOPSIS

DESCRIPTION

जरूरी नहीं कि हर चीज स्थानीय हो जाए

WebGPU क्यों मायने रखता है

अंतर्निहित AI: जब ब्राउज़र मॉडल लाता है

फ़ॉलबैक कोई दुखद योजना बी नहीं है

मॉडल का UX मायने रखता है

गोपनीयता: बेहतर, स्वचालित रूप से सुरक्षित नहीं

जहां यह वास्तव में दिलचस्प हो जाता है

उत्पादन से पहले चेकलिस्ट

सही समझौता

उपयोगी स्रोत

METADATA

SEE ALSO