فهرست مطالب
Toggleمعرفی و ضرورت
احتمالا شما هم هنگام نوشتن یک پروژه با خطا یا Error مواجه شدید و اگر نتوانستید آن را حل کنید از دوستان یا استاد خود روش حل آنرا پرسیده اید. نوشتن برنامه و برنامه نویسی، یعنی حل مسئله یعنی وقت گذاشتن برای پیدا کردن راه حل بهینه. حال آیا امکان دارد افراد تجارب خودشون رو برای رفع خطاهای برنامه نویسی باهم به اشتراک بگذارند و ما بدون فوت وقت از آن استفاده کنیم؟
جواب شما بله هست ، این نیاز از قدیم بوده و افراد زیاد در صدد راه اندازی انجمن های علمی تخصصی بودن که در عین رعایت حریم شخصی ، افراد محتوای خودشون رو به اشتراک بگذارند.به مرور این کلونی ها تخصصی تر و سازمان یافته تر شد و امکانات زیادی به ان اضافه شد تا اکنون که شاهد منابع متعددی در این حوزه هستیم. توجه کنید که اساس شکل گیری منابع متن باز استفاده از راه حل مسائل حل شده است و وقت گذاشتن روی مسائل حل نشده؛ به این معنی که منابع متن باز صرفا در مسائلی که قبلا حل شده اند کمک شما خواهند بود و شما باید توجه اصلی تان را روی مسائل حل نشده خودتان بزارید.
ماجرا به همین راحتی هم نیست؛ پیدا کردن جوابی که بیشترین شباهت را به کاربرد شما داشته باشد در بعضی از مواقع بسیار دشوار است. مثلا شاید چند سال پی،در گوشه دیگر جهان یک محقق در پیدا کردن ژنوم سرطان در DNA انسان تحقیق کرده باشد و کد سورس تحقیق هایش را با شما به اشتراک گذاشته باشد و مسئله شما هم پیدا کردن فرد مجرم به واسطه دوربین های نظارتی باشد و با همان الگوریتم حل شود.
“در حال حاضر 48 درصد از شرکت ها هوش مصنوعی و ماشین لرنینگ از منابع متن باز برای هوش مصنوعی استفاده می کنند، این تعداد تا سال 2023 به 65 درصد خواهد رسید.”
اطلاعات به اشتراک گذاشته شده دقیقا چی هستن؟
خب حالا میخواهیم بررسی کنیم که داخل این منابع متن باز که در بالا به ضرورت و تعریفش پرداختیم ، دقیقا چه اطلاعاتی پیدا می شود؟
مجموعه داده های منبع باز Open source datasets :
هوش مصنوعی بر روی داده ها آموزش داده می شود. به عبارتی موتور محرکه هوش مصنوعی داده ها هستند، از این جهت پیدا کردن داده های مناسب پروژه شما از درجه اهمیت بالایی برخوردار هست. در این سایت ها داده های آموزشی و داده های تست به صورت رایگان در دسترس هستند. حتی اگر در صدد انجام پروژ تجاری هم هستید میتوانید از این مجموعه دادهها استفاده کنید.
الگوریتم های منبع باز یا Open source algorithms:
ما برای استفاده و کار با داده ها نیاز به الگوریتم هستیم. ولی نکته اینجاست که الگوریتم بهینه برای هر کار متفاوت طراحی می شود. یکی از چالش های شرکت های بزرگ هوش مصنوعی طراحی و تولید الگوریتم های بهینه تر و با سرعت بالاتر هست . اینجا هم منابع متن باز وجود دارند و شما میتوانید از الگوریتم دیگر متخصصان این حوزه استفاده کنید که معمولاً بهعنوان کتابخانههای الگوریتم منبع باز در دسترس هستند که میتوانید آنها را به همان صورت اجرا کنید.
معیار درست و اشتباه بودن در منابع متن باز دقیقا چی هست؟
تایید اجتماعی! به این معنی که برای یک سوال پاسخ های متعددی ثبت می شود و سایر کاربران میتوانند به پاسخ ها امتیاز بدهند. بدین ترتیب یکسری از پاسخ ها از جانب کاربران دارای بالاترین امتیاز می شوند و در اولویت نمایش قرار میگیرند.
حال هرچه قدر شما پاسخ با امتیاز بالاتری دریافت کنید تایید اجتماعی بیشتری پیدا میکنید و به مرور زمان اکانت شما دارای اعتبار اجتماعی می شود.
آیا فعالیت درمنابع متن باز فقط خیر خواهانه است؟!؟
نه! منابع متن باز در اصل به شما تایید اجتماعی میدهند. این تایید اجتماعی از طرف افراد مبتدی و عمومی نیست ز طرف افرادی هست که دقیقا در حوزه افرادی هست و شما با انها سر و کاردارید.بدین ترتیب که بسیاری از شرکت ها در حوزه تخصصی شما ، متوجه فعالیت های شما می شوند و یا می توانید از اعتبار اکانت تان استفاده کنید برای چه موضوعی؟ مشخص است برای استخدام در پوزیشن های تخصصی، برای اپلای، برای اخذ پروژه و… . همچنین افراد فنی در حوزه کاری خودتان را راحت تر پیدا میکنید و همین موضوع میتواند فرصت های بسیار زیادی را برای شما ایجاد کند.
سود موسسین منابع متن باز در چی هست؟
در ظاهر منابع متن باز یک خیریه عام المنفعه هست ولی در عمل برای دسترسی به یک سری ویژگی های خاص شبیه به یک بنگاه اقتصادی عمل میکند.
برای متخصصین:
با فروش اکانت vip و دسترسی بیشتر و بهتر به محتوا های تولید شده دارید و همچنین از فرصت شغلی سریع تر با خبرمی شوید.
برای سازمان ها:
فرصت کشف نیرو های توانمند خصوصا به صورت ریموت چرا که اکثر افراد در این انجمن های تخصصی علاقه مند به دور کاری هستند و بررسی دقیق اکانت ها برای اپلای تحصیلی میتواند بار مالی و زمانی بسیار زیادی از شرکت برای جذب نیرو توانمند کم کند.
بررسی چند منبع متن باز مهم
- استک اورفلو stackoverflow
- گیت هابcom
- کگلkaggle
- گوگلgoogle
- Acumos AI
- ClearML
حقیقت این هست که…
الف) مشکلی که الان با آن مواجه هستید قبلا به ذهن هزاران نفر رسیده و بی شمار جواب برای آن هست.
ب) به احتمال 99 درصد پاسخ سوال شما در منابع متن باز موجود هست.
ج) پس تنها کاری که باید بکنید این هست که خطا و یا عنوان مشکل خود را در گوگل سرچ کنید.
1- استک اورفلوStack Overflow
الف- معرفی کلی
در سال 2008 توسط وسط جف اتوود و جویل اسپولسکی راه اندازی شد. جالبه بدونید که استک اورفلو :
- 100 میلیون بازدید کننده ماهانه دارد.
- 21 میلیون سؤال پرسیده شده تا به امروز در آن موجود است.
- 6 ثانیه میانگین زمان بین سؤالات جدید
- فعالیت بیش از 10000 شرکت.
- این وبگاه ۴۰مین وبگاه پربازدید در ایران است(طبق آمار الکسا).
- امریکا ،هند، چین ، ژاپن و ایران پنج کشور بازدیدکننده از این وبگاه هستند.( طبق آمار الکسا)
.
ب- معرفی قسمت های مختلف سایت
2- گیت هاب
گیت هاب در سال 2007 توسط روبی آن ریلز و ارلنگ ساخته شد و در سال 2018 در یک کشمکش توسط مایکروسافت خریداری شد. مایکروسافت توجه زیادی به ابر رایانش ابری دارد و همین موضوع باعث شد امکان تست و کنترل نسخه در github موجود باشد. هم چنین در آن می توانید تیم بسازید و بهطور مشترک روی پروژههای مختلف کار کنید. این موضوع علاوه بر بحث متن باز بودن و قابلیت به اشتراک گذاری کد های پروژه هست.
ویژگی های گیت هاب:
- تیم سازی
- کنترل پروژه
- آموزش
- سوال پرسیدن و رفع ارو
- کنترل ورژن
- استفاده از پروژه دیگران
3- کگل Kaggle
Kaggle در سال ۲۰۱۰ با راه اندازی مسابقات یادگیری ماشین شروع به کار کرد و اکنون همچنین یک پلت فرم داده عمومی، یک میز کار مبتنی بر ابر برای علم داده و آموزش هوش مصنوعی ارائه میدهد. حقوق صاحبان سهام در سال ۲۰۱۱ جمعآوری شد و ارزش شرکت را ۲۵ میلیون دلار اعلام کرد. در ۸ مارس ۲۰۱۷، گوگل اعلام کرد که در حال خرید کگل هستند.
خدماتی که کگل ارائه می کنه چیه؟
- رقابتهای یادگیری ماشین: اولین محصول کگل بود و هنوز هم مشهور است.
- کرنل کگل:محیط کار بر پایه ابر برای دانش دادهها و یادگیری ماشین.
- مجموعه دادههای عمومی: اعضای جامعه مجموعه داده را با یکدیگر به اشتراک میگذارند.
- یادگیری کگل: مقالات و محتوا های آموزشی رایگان
- خدماتی برای کارفرمایان یادگیری ماشین