آموزش جامع تبدیل و پردازش داده‌های JSON با jq |

مقدمه

کار با فایل‌های JSON بزرگ، مخصوصا در پروژه‌های واقعی، معمولا زود از کنترل خارج می‌شود. داده زیاد است، ساختار تو در توست و اگر بخواهید همه‌چیز را با کپی‌پیست یا اسکریپت‌های دست‌ساز مدیریت کنید، هم زمان از دست می‌رود هم احتمال خطا بالا می‌رود.

ابزارهای کلاسیک لینوکس مثل grep، sed و awk برای متن آزاد عالی هستند، اما وقتی پای داده ساخت‌یافته مثل JSON وسط باشد، این ابزارها دیگر انتخاب حرفه‌ای محسوب نمی‌شوند.

اینجاست که jq وارد می‌شود.

jq یک ابزار خط فرمان برای خواندن، فیلتر کردن و تبدیل JSON است که به‌طور خاص برای داده‌های ماشین‌خوان طراحی شده. این ابزار در اسکریپت‌های شِل، پایپ‌لاین‌های DevOps، پردازش خروجی APIها، Kubernetes و حتی آماده‌سازی داده برای مدل‌های یادگیری ماشین، یک ابزار کلیدی محسوب می‌شود.

در این آموزش از «دیدگاه»، jq را از پایه یاد می‌گیرید و قدم‌به‌قدم به سناریوهای واقعی و حرفه‌ای می‌رسید.

چرا jq مهم است؟

JSON را «می‌فهمد»، نه اینکه فقط متن را دستکاری کند
بسیار سریع است (با زبان C نوشته شده)
می‌تواند فایل‌های چند گیگابایتی را بدون مصرف دیوانه‌وار حافظه پردازش کند
برای DevOps، Kubernetes و AI کاملا کاربردی است
به‌راحتی در اسکریپت‌ها و CI/CD استفاده می‌شود

نکات کلیدی این آموزش

در این مقاله یاد می‌گیرید:

اصول پایه jq و فیلترهای مهم آن
استخراج داده از آرایه‌ها و آبجکت‌ها
جمع‌زدن، فیلتر شرطی و ساخت داده جدید
ترکیب چند فیلتر در یک دستور
بهینه‌سازی jq برای فایل‌های بزرگ
استفاده از jq در DevOps، Kubernetes و AI
مدیریت خطا و داده‌های ناقص

پیش‌نیازها

برای دنبال‌کردن این آموزش نیاز دارید به:

سیستم لینوکس (ترجیحا اوبونتو)
آشنایی مقدماتی با JSON
نصب jq

نصب jq در اوبونتو

بررسی نصب

قدم اول: اجرای اولین دستور jq

jq می‌تواند ورودی را از فایل یا pipe دریافت کند. در این آموزش از فایل استفاده می‌کنیم.

ساخت فایل نمونه

فایلی به نام seaCreatures.json بسازید:

محتوا:

تست jq با identity operator

ساده‌ترین فیلتر jq، نقطه (.) است که ورودی را بدون تغییر چاپ می‌کند:

اگر خروجی را بدون خطا دیدید، یعنی jq آماده کار است.
jq به‌صورت پیش‌فرض خروجی را pretty print می‌کند، که برای خواندن JSON عالی است.

قدم دوم: استخراج نام موجودات

برای کار روی عناصر داخل آرایه باید از iterator استفاده کنیم:

حالا برای گرفتن فقط نام‌ها:

خروجی به‌صورت JSON string خواهد بود. اگر رشته خام می‌خواهید:

قدم سوم: محاسبه مجموع clams

استخراج مقادیر clams

تبدیل به آرایه

استفاده از map (خواناتر و حرفه‌ای‌تر)

جمع کل

خروجی:

قدم چهارم: محاسبه clams دلفین‌ها

اینجا باید فقط موجوداتی را انتخاب کنیم که نوعشان dolphin است.

حالا فقط clams آنها:

و در نهایت جمع:

خروجی:

قدم پنجم: ساخت ساختار JSON جدید

حالا همه‌چیز را در یک خروجی تمیز و کاربردی ترکیب می‌کنیم:

خروجی نهایی

این دقیقا همان چیزی است که در پروژه‌های واقعی به آن نیاز دارید:
تبدیل داده، نه فقط نمایش آن.

تکنیک‌های پیشرفته jq برای محیط عملیاتی

پردازش فایل‌های بزرگ (۵ گیگابایت به بالا)

استفاده از حالت streaming:

خروجی فشرده برای مصرف کمتر حافظه

استفاده از jq در AI و یادگیری ماشین

آماده‌سازی داده برای مدل ML

پردازش داده بلادرنگ

jq در Kubernetes و DevOps

پردازش خروجی kubectl

استفاده در CI/CD

مدیریت خطا و داده ناقص

جلوگیری از خطا در فیلدهای ناموجود

اعتبارسنجی ساختار JSON

جمع‌بندی

jq یکی از آن ابزارهایی است که وقتی درست یادش بگیرید، دیگر حاضر نیستید بدون آن کار کنید.

با jq می‌توانید:

JSON را اصولی پردازش کنید
داده‌ها را برای DevOps و AI آماده کنید
اسکریپت‌های تمیز و قابل نگهداری بنویسید
فایل‌های بزرگ را بدون له شدن سیستم مدیریت کنید

دیدگاه توصیه می‌کند:
اگر با JSON سروکار دارید و jq بلد نیستید، دارید سخت‌ترین راه ممکن را انتخاب می‌کنید.