বিষয়বস্তুর বাইরেও, আমরা যে ফাইলগুলি তৈরি করি বা আমাদের কম্পিউটারে দেখি সেগুলিতে তথ্য থাকে। মেটাডেটা নামে পরিচিত। এই পোস্টে আমরা দেখব কিভাবে উবুন্টুতে মেটাডেটা দেখতে এবং সম্পাদনা করতে হয়।
মেটাডেটার কাজ হল একটি ফাইলকে বর্ণনা করা, সংগঠিত করা এবং প্রসঙ্গ প্রদান করা যাতে এটি বোঝা, অনুসন্ধান, শ্রেণীবদ্ধ করা এবং বিশ্লেষণ করা সহজ হয়।
মেটাডেটা কিসের জন্য?
মেটাডেটার কার্যাবলী
- অনুসন্ধান: ফাইল এক্সপ্লোরার বর্ণানুক্রমিক ক্রম, ফাইলের ধরণ, তৈরি বা পরিবর্তনের তারিখ অনুসারে মেটাডেটা প্রদর্শন করে।
- সংগঠন: মেটাডেটা বিপুল পরিমাণে তথ্য সংগঠিত করতে সাহায্য করে।
- উপলব্ধি: তারা কৃত্রিম বুদ্ধিমত্তা মডেল, সার্চ ইঞ্জিন বা লাইব্রেরির মতো স্বয়ংক্রিয় সিস্টেমগুলিকে বিষয়বস্তু আরও ভালভাবে বুঝতে সাহায্য করে
মেটাডেটার প্রকার
আমরা তাদের তিনটি শ্রেণীতে ভাগ করতে পারি:
- বর্ণনামূলক: ডকুমেন্ট শনাক্তকারী ডেটা যেমন শিরোনাম, লেখক, বর্ণনা এবং কীওয়ার্ড।
- কাঠামোগত: ডকুমেন্টটি কীভাবে গঠন করা হয়েছে: শিরোনাম, সাবটাইটেল, অধ্যায়, বিন্যাস।
- প্রশাসনিক: অনুমতি, তৈরির তারিখ, আকার, বিন্যাস।
উবুন্টুতে মেটাডেটা কীভাবে দেখা এবং সম্পাদনা করা যায়
মেটাডেটা সম্পাদনার জন্য বেশ কিছু গ্রাফিক্যাল টুল আছে, কিন্তু এই পোস্টে আমরা শুধুমাত্র টার্মিনাল ব্যবহারকারীদের উপর আলোকপাত করব।
পিডিএফ
পিডিএফ ডকুমেন্টের নিম্নলিখিত ফর্ম্যাট রয়েছে:
- যোগ্যতা।
- লেখক.
- বিষয়
- কীওয়ার্ডস
- তৈরির তারিখ
- পরিবর্তনের তারিখ।
- জেনারেটর ইঞ্জিন।
- তৈরির জন্য ব্যবহৃত সফটওয়্যার।
- সুরক্ষা এবং অনুমতি।
XMP নামক আরেকটি ফর্ম্যাট আছে যেখানে এই তথ্যটিও অন্তর্ভুক্ত রয়েছে:
- কপিরাইট তথ্য।
- থাম্বনেইলস।
- নথির ভাষা।
- কাস্টম লেবেল।
উবুন্টুতে মেটাডেটা দেখার জন্য দুটি কার্যকর কমান্ড রয়েছে:
পিডিফিনফো
এর সাথে ইনস্টল করে:
sudo apt install poppler-utils
ব্যবহার করুন:
pdfinfo nombre_archivo.pdf
এক্সিফটুল
এই টুলটি দিয়ে আমরা XMP ফরম্যাটে মেটাডেটা দেখতে পারি।
এর সাথে ইনস্টল করে:
sudo apt install libimage-exiftool-perl
ব্যবহার
exiftool nombre_archivo.pdf
মেটাডেটা সম্পাদনা করতে আমরা কমান্ডটি ব্যবহার করি
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
আমাদের উদাহরণে, যদি আমরা শিরোনামটি অনুবাদ করতে চাই:
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
আমরা নিম্নলিখিত পদ্ধতি ব্যবহার করে সমস্ত মেটাডেটা মুছে ফেলতে পারি:
exiftool -all= nombre_archivo.pdf
যদি আমরা এটি মুছে ফেলার জন্য অনুতপ্ত হই, তাহলে কমান্ডটি PDF ফাইলের একটি অনুলিপি তৈরি করে এবং নামের সাথে "মূল" স্পষ্টীকরণ যোগ করে।
DOCX
ওয়ার্ডের নেটিভ ফর্ম্যাটে ডকুমেন্ট মেটাডেটা এবং অ্যাপ্লিকেশন মেটাডেটা অন্তর্ভুক্ত রয়েছে।
ডকুমেন্ট মেটাডেটাতে অন্তর্ভুক্ত রয়েছে:
- যোগ্যতা।
- লেখক.
- শেষ ব্যক্তি যিনি এটি পরিবর্তন করেছিলেন।
- রিভিশনের সংখ্যা।
- তৈরির তারিখ.
- সর্বশেষ পরিবর্তিত তারিখ।
- বিষয়
- মূলশব্দ।
- শ্রেণী।
- বিভাগ
- অবস্থা (খসড়া, চূড়ান্ত)।
অ্যাপ্লিকেশন মেটাডেটা
- টেমপ্লেট
- ব্যবহৃত সফটওয়্যার।
- মোট পৃষ্ঠা সংখ্যা।
- শব্দের সংখ্যা।
- অক্ষরের সংখ্যা।
- লাইনের সংখ্যা।
- অনুচ্ছেদের সংখ্যা।
- স্কেলিং সেটিংস।
- সংগঠন.
- দলের নেতার নাম।
এক্সিফটুল
কমান্ড এক্সিফটুল এটি একটি ওয়ার্ড ডকুমেন্টের মেটাডেটা দেখতেও ব্যবহার করা যেতে পারে।
ব্যবহার
exiftool nombre_archivo.docx
মেটাডেটা দেখার আরেকটি উপায় হল ফাইল এক্সটেনশনটি জিপ ফর্ম্যাটে পরিবর্তন করা। নিরাপত্তার কারণে, আমরা এটি একটি কপি দিয়ে করব।
cp nombre_archivo.docx copia_archivo.zip
আমরা ফাইলটি আনজিপ করি এবং আমাদের প্রয়োজনীয় ফোল্ডারটি খুলি
unzip copia_archivo.zip -d docxinfo
আমরা ফাইলগুলি থেকে তথ্য পড়ি
cat docxinfo/docProps/core.xml
ডকুমেন্ট মেটাডেটার জন্য
cat docxinfo/docProps/apdp.xml
অ্যাপ্লিকেশন মেটাডেটার জন্য
cat docxinfo/docProps/app.xml
উভয়ই ব্যবহার করে Exiffool. আমরা মেটাডেটা ম্যানুয়ালি সম্পাদনা করতে পারি। আবার, exiftool এর পদ্ধতিটি PDF এর ক্ষেত্রে যেমনটি করেছিলাম তেমনই।
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
আমরা একই কাজটি ম্যানুয়ালি করতে পারি নিম্নরূপ:
আমরা একটি ব্যাকআপ করি
cp nombre_archivo.docx copia_archivo.zip
আমরা এটিকে মেটাডেটা নামক একটি ফোল্ডারে আনজিপ করেছি।
unzip copia_archivo.zip -d metadatos
আসুন ফোল্ডারে যান
cd metadatos
আমরা সম্পাদকটি খুলি।
ডকুমেন্ট মেটাডেটার জন্য
nano docProps/core.xml
nano docProps/apdp.xml অ্যাপ্লিকেশন মেটাডেটার জন্য
আমরা ফাইলটিকে docx হিসেবে পুনরায় প্যাকেজ করি
zip -r ../nombre_archivo2.docx *
কমান্ডটি ডিরেক্টরির বাইরে নতুন ডকুমেন্ট তৈরি করে। মেটাডাটা.