مجموعه دادگان توییتر

این مجموعه دادگان متشکل از 15811468 پیام توییتری منتشر شده در شبکه اجتماعی توییتر است که این مقدار توییت از تعداد سیصد هزار کاربر فارسی زبان این شبکه اجتماعی جمع‌آوری شده است. در این مجموعه دادگان به ترتیب علاوه بر تاریخ انتشار هر توییت، متن، تعداد بازنشرها(ریتوییت)، تعداد فیو، شناسه یکتای کاربر منتشر کننده، تعداد دنبال کنندگان کاربر منتشر کننده، تعداد دنبال شوندگان کاربر منتشر کننده و تعداد کل توییت‌های منتشر شده توسط آن کاربر نیز به ازای هر توییت وجود دارد. نکته مهم در خصوص این مجموعه دادگان حفظ محرمانگی کاربران منتشر کننده هر توییت است. به عبارت دیگر شناسه یکتای کاربران حقیقی نبوده و عددی افزایشی است که به هر کدام از کاربران موجود در این مجموعه دادگان نسبت داده شده است. همچنین تمام منشن کاربران نیز از این مجموعه دادگان حذف شده است

شرایط استفاده از دیتاست

این مجموعه دادگان تحت مجوز بین المللی CC-BY-SA-NC نسخه 4 می‌باشد
کاربران باید نام شرکت دیتاک و سکو را در منابع مقاله های تحقیقاتی خود ذکر نموده و به آدرس وبسایت سکو http://sakoo.dataak.com اشاره نمایند.
زمان تولید
1397
سایز
96Mb
فرمت
csv
تولید کننده
Dataak
منبع
Twitter