ডিপসিকের চেয়ে ভাল মডেল এবং স্থানীয়ভাবে সেগুলি কীভাবে ইনস্টল করবেন

কিছু এআই মডেল আপনি স্থানীয়ভাবে ইনস্টল করতে পারেন

কয়েকদিন আগে আমার সঙ্গী পাবলিনাক্স তাদের বলা কীভাবে স্থানীয়ভাবে ফ্যাশনেবল কৃত্রিম বুদ্ধিমত্তা মডেল ইনস্টল করবেন। এই পোস্টে আমি সেগুলির তালিকা করব যেগুলি আমার মতে ডিপসিকের চেয়ে ভাল মডেল এবং কীভাবে সেগুলি আমাদের কম্পিউটারে ইনস্টল এবং চালানো যায়।

কোনো রাজনৈতিক সহানুভূতি বা অ্যান্টিপ্যাথি বাদ দিয়ে, চীনা সরকারের পদক্ষেপটি ছিল সান জু-এর যোগ্য কূটনৈতিক বিপণনের একটি মাস্টারপিস। ডোনাল্ড ট্রাম্পের "এলিফ্যান্ট ইন দ্য গ্লাসওয়্যার" শৈলীর বিপরীতে, তারা একটি মডেল ঘোষণা করেছে যা বিনামূল্যে ChatGPT-এর মতো একই বৈশিষ্ট্য অফার করে এবং কম সংস্থান খরচ করে। আমরা যারা টপিক অনুসরণ করি তারাই তা জানি আরও অনেক ওপেন সোর্স মডেল রয়েছে (কিছু উত্তর আমেরিকার কোম্পানি যেমন মেটা থেকে) এবং DeepSeek-এর পারফরম্যান্স শুধুমাত্র ChatGPT-এর সাথে তুলনীয় 5% সাধারণ ব্যবহারের ক্ষেত্রে।

বড় মাপের ভাষা মডেল

চ্যাটজিপিটি, ডিপসিক এবং অন্যদেরকে বলা হয় লার্জ স্কেল ল্যাঙ্গুয়েজ মডেল। মূলত তারা একজন ব্যবহারকারীকে একটি কম্পিউটারের সাথে অন্য মানুষের সাথে যোগাযোগের জন্য ব্যবহৃত ভাষার অনুরূপ একটি কম্পিউটারের সাথে যোগাযোগ করার অনুমতি দেয়। এটি অর্জন করার জন্য, তাদের প্রচুর পরিমাণে পাঠ্য এবং নিয়মাবলীর সাথে প্রশিক্ষিত করা হয় যা তাদের ইতিমধ্যে যা আছে তা থেকে নতুন তথ্য তৈরি করতে দেয়।
এর প্রধান ব্যবহার হল প্রশ্নের উত্তর, পাঠ্য সংক্ষিপ্ত করা, অনুবাদ করা এবং বিষয়বস্তু পুনরুত্পাদন করা।

ডিপসিকের চেয়ে ভাল মডেল এবং স্থানীয়ভাবে সেগুলি কীভাবে ইনস্টল করবেন

Pablinux এর মত, আমরা ওল্লামা ব্যবহার করতে যাচ্ছি। এটি একটি টুল যা আমাদেরকে লিনাক্স টার্মিনাল থেকে বিভিন্ন ওপেন সোর্স মডেল ইনস্টল, আনইনস্টল এবং ব্যবহার করতে দেয়। কিছু ক্ষেত্রে ব্রাউজারটিকে গ্রাফিকাল ইন্টারফেস হিসাবে ব্যবহার করা যেতে পারে, তবে আমরা এই নিবন্ধে এটি দেখতে পাব না।

ওল্লামা একটি সঠিক ব্যবহারকারীর অভিজ্ঞতা প্রদানের জন্য, একটি ডেডিকেটেড GPU থাকা ভাল.বিশেষ করে আরো পরামিতি সঙ্গে মডেল. যাইহোক, কম শক্তিশালীগুলি একটি রাস্পবেরি পাইতে ব্যবহার করা যেতে পারে এবং যখন আমি 7 গিগাবাইট সহ একটি কম্পিউটারে 6 বিলিয়ন প্যারামিটার সহ মডেলগুলি পরীক্ষা করেছিলাম এবং একটি ডেডিকেটেড GPU ছাড়াই কম্পিউটারটি সমস্যা ছাড়াই কাজ করেছিল। 13 বিলিয়নের মধ্যে একটির সাথে একই ঘটনা ঘটেনি।

প্যারামিটার হল সেই নিয়মগুলি যা মডেলটি সম্পর্ক তৈরি করতে এবং ডেটার মধ্যে প্যাটার্ন তৈরি করতে ব্যবহার করে। যত বেশি প্যারামিটার এবং ডেটা, একটি মডেল তত বেশি শক্তিশালী হবে যাদের কম প্যারামিটার রয়েছে তারা টারজানের মতো স্প্যানিশ ভাষায় কথা বলে।

আমরা কমান্ড দিয়ে ওল্লামা ইনস্টল করতে পারি
sudo apt install curl
curl -fsSL https://ollama.com/install.sh | sh

আমরা কমান্ড দিয়ে মডেলটি ইনস্টল করতে পারি:
ollama pull nombre_del modelo
এবং এটি দিয়ে চালান:
ollama run nombre_del_modelo
আমরা এটি ব্যবহার করে আনইনস্টল করি:
ollama rm nombre_del_modelo
আমরা লিখে ইনস্টল করা মডেল দেখতে পারি:
ollama list

নিম্নলিখিত মডেলগুলির একটি ছোট তালিকা যা আমার কাছে সবচেয়ে আকর্ষণীয় বলে মনে হচ্ছে: আপনি উপলব্ধ মডেলগুলির সম্পূর্ণ তালিকা খুঁজে পেতে পারেন এখানে:

llama2-সেন্সরবিহীন

লামা মেটা দ্বারা তৈরি একটি সাধারণ উদ্দেশ্য মডেল। এই সংস্করণে আইনি বা রাজনৈতিক কারণে মূল প্রকল্পের বিকাশকারীরা যে সমস্ত বিধিনিষেধ প্রবর্তন করেছিল তা সরানো হয়েছে।. এটির দুটি সংস্করণ রয়েছে, একটি হালকা যা 8GB দিয়ে পরিচালনা করে এবং সম্পূর্ণ একটি যার প্রয়োজন 64৷ এটি প্রশ্নের উত্তর দিতে, পাঠ্য লিখতে বা কোডিং কাজগুলিতে ব্যবহার করা যেতে পারে
এর সাথে ইনস্টল করে:
ollama pull llama2-uncensored
এবং এটি এর সাথে সম্পাদিত হয়:
ollama run llama2-uncensored

কোডজেমা

কোডজেমা হল হালকা কিন্তু শক্তিশালী মডেলের একটি নির্বাচন যা আপনাকে বিভিন্ন ধরনের প্রোগ্রামিং কাজ সম্পাদন করতে দেয় কোড সম্পূর্ণ করা বা স্ক্র্যাচ থেকে লেখার মতো। প্রাকৃতিক ভাষা বোঝে, নির্দেশাবলী অনুসরণ করতে পারে এবং গাণিতিক যুক্তি করতে পারে।

3টি ভেরিয়েন্টে আসে:

  • নির্দেশ: প্রাকৃতিক ভাষাকে কোডে রূপান্তরিত করে এবং নির্দেশাবলী অনুসরণ করতে পারে:
  • কোড:  ইতিমধ্যে বিদ্যমান কোডের অংশগুলি থেকে কোডটি সম্পূর্ণ করে এবং তৈরি করে।
  • 2 বি: দ্রুত কোড সমাপ্তি টাস্ক.

টাইনিলামা

এর নাম থেকেই বোঝা যায়, এটি মূল মেটা মডেলের একটি ছোট সংস্করণ।. অতএব, এটির এত ভাল ফলাফল হবে না, তবে আপনি যদি দেখতে চান যে কীভাবে একটি কৃত্রিম বুদ্ধিমত্তা মডেল পরিমিত হার্ডওয়্যারে কাজ করে তবে এটি পরীক্ষা নেওয়ার মতো। এটির মাত্র 1100 বিলিয়ন প্যারামিটার রয়েছে।

স্থানীয়ভাবে মডেলগুলি ব্যবহার করে গোপনীয়তা এবং সেন্সরশিপ বা পক্ষপাত ছাড়া সংস্করণগুলিতে অ্যাক্সেসের সুবিধা রয়েছে, যা কিছু ক্ষেত্রে হাস্যকর হতে থাকে। মাইক্রোসফ্টের কৃত্রিম বুদ্ধিমত্তা আমার জন্য একটি ড্যাচসুন্ডের চিত্র তৈরি করতে অস্বীকার করেছিল কারণ এটি "বিচ" শব্দটিকে আক্রমণাত্মক বলে মনে করে। সবচেয়ে বড় অসুবিধা হল হার্ডওয়্যারের প্রয়োজনীয়তা। এটি মডেলগুলি চেষ্টা করা এবং আপনার যা প্রয়োজন তার জন্য যথেষ্ট ভাল এবং আপনার কাছে থাকা সরঞ্জামগুলিতে চালানো যেতে পারে এমন একটি সন্ধান করা একটি বিষয় হবে৷