خوشه بندی معنایی کلمات کلیدی برای بیش از 10000 کلمه کلیدی [با اسکریپت]

خوشه بندی کلمات کلیدی معنایی می تواند تحقیقات کلمات کلیدی شما را به سطح بعدی برساند. در اینجا یک اسکریپت پایتون برای کمک به شما در انجام این کار وجود دارد.
خوشه‌بندی معنایی کلمات کلیدی می‌تواند به ارتقای تحقیقات کلیدواژه شما به سطح بعدی کمک کند.
در این مقاله، نحوه استفاده از برگه Google Colaboratory را که به طور انحصاری با خوانندگان Search Engine Journal به اشتراک گذاشته شده است، یاد خواهید گرفت.
این مقاله با استفاده از برگه Google Colab، یک نمای سطح بالا از نحوه عملکرد آن در زیر کاپوت و نحوه انجام تنظیمات مطابق با نیازهای خود، شما را راهنمایی می کند.
اما ابتدا، اصلاً چرا کلمات کلیدی را خوشه بندی کنیم؟
در اینجا چند مورد استفاده برای خوشه بندی کلمات کلیدی آورده شده است.
تحقیق سریعتر کلمات کلیدی:
کمپین های جستجوی پولی:
در اینجا نمونه ای از اسکریپت است که سوالات مشابه را با هم جمع می کند، که برای یک مقاله عمیق عالی است!
اگر کارهای من را در توییتر دنبال کرده باشید، می دانید که من مدتی است که در حال آزمایش خوشه بندی کلمات کلیدی هستم.
نسخه های قبلی این اسکریپت بر اساس کتابخانه عالی PolyFuzz با استفاده از تطبیق TF-IDF بود.
در حالی که کار انجام می‌شد، همیشه تعدادی خوشه‌های سرخراش وجود داشت که احساس می‌کردم می‌توان نتیجه اصلی را بهبود بخشید.
کلماتی که الگوی مشابهی از حروف دارند، حتی اگر از نظر معنایی به هم مرتبط نباشند، خوشه‌بندی می‌شوند.
برای مثال، نتوانست کلماتی مانند «دوچرخه» را با «دوچرخه» دسته بندی کند.
نسخه های قبلی اسکریپت مشکلات دیگری نیز داشتند:
چهار ماه به آخرین نسخه که به طور کامل برای استفاده از جاسازی جملات یادگیری عمیق و پیشرفته بازنویسی شده است، به جلو بروید.
برخی از این خوشه های معنایی عالی را بررسی کنید!
توجه داشته باشید که گرم، حرارتی و گرم در یک دسته از کلمات کلیدی قرار دارند؟
یا در مورد، عمده و عمده چطور؟
سگ و داچشوند، کریسمس و کریسمس؟
حتی می تواند کلمات کلیدی را به بیش از صد زبان مختلف خوشه بندی کند!
علاوه بر گروه بندی کلمات کلیدی معنایی ، بهبودهای زیر به آخرین نسخه این اسکریپت اضافه شده است.
برای شروع، باید روی این پیوند کلیک کنید و سپس گزینه Open in Colab را مطابق شکل زیر انتخاب کنید.
با انتخاب Runtime > Change Runtime Type ، نوع Runtime را به GPU تغییر دهید.
Runtime > Run all را از پیمایش بالای Google Colaboratory انتخاب کنید (یا فقط Ctrl+F9 را فشار دهید).
هنگامی که از شما خواسته شد یک فایل csv. حاوی ستونی به نام «کلید واژه» آپلود کنید.
خوشه بندی باید نسبتاً سریع باشد، اما در نهایت به تعداد کلمات کلیدی و مدل استفاده شده بستگی دارد.
به طور کلی، شما باید برای 50000 کلمه کلیدی خوب باشید.
اگر خطای Cuda Out of Memory می‌بینید، سعی می‌کنید کلمات کلیدی زیادی را هم‌زمان خوشه‌بندی کنید!
(شایان ذکر است که این اسکریپت به راحتی می تواند آداپتوری برای اجرا در یک ماشین محلی بدون محدودیت Google Colaboratory باشد.)
اسکریپت اجرا می شود و خوشه ها را به فایل اصلی شما به ستون جدیدی به نام Cluster Name اضافه می کند.
نام های خوشه با استفاده از کوتاه ترین طول کلمه کلیدی در خوشه اختصاص داده می شود.
به عنوان مثال، نام خوشه برای گروه کلمات کلیدی زیر به عنوان "جوراب آلپاکا" تنظیم شده است، زیرا کوتاه ترین کلمه کلیدی در خوشه است.
پس از تکمیل خوشه‌بندی، یک فایل جدید به‌طور خودکار ذخیره می‌شود و دسته‌بندی‌شده در یک ستون جدید به فایل اصلی اضافه می‌شود.
این اسکریپت بر اساس الگوریتم Fast Clustering است و از مدل هایی استفاده می کند که از قبل در مقیاس بر روی مقادیر زیادی داده آموزش دیده اند.
این امر محاسبه روابط معنایی بین کلمات کلیدی را با استفاده از مدل های خارج از قفسه آسان می کند.
(برای استفاده از آن لازم نیست دانشمند داده باشید!)
در واقع، در حالی که من آن را برای کسانی که دوست دارند سرهم‌بندی و آزمایش کنند، قابل سفارشی‌سازی کرده‌ام، برخی پیش‌فرض‌های متعادل را انتخاب کرده‌ام که باید برای موارد استفاده بیشتر افراد معقول باشد.
بسته به نیاز، مدل‌های مختلف را می‌توان در داخل و خارج از اسکریپت تعویض کرد (خوشه‌بندی سریع‌تر، پشتیبانی از چند زبان بهتر، عملکرد معنایی بهتر و غیره).
پس از آزمایش های زیاد، با استفاده از ترانسفورماتور تمام MiniLM-L6-v2 که تعادل عالی بین سرعت و دقت را فراهم می کرد، تعادل کامل سرعت و دقت را پیدا کردم.
اگر ترجیح می دهید از مدل خود استفاده کنید، فقط می توانید آزمایش کنید، می توانید مدل از پیش آموزش دیده موجود را با هر یک از مدل های لیست شده در اینجا یا در Hugging Face Model Hub جایگزین کنید.
تعویض در مدل ها به آسانی جایگزینی متغیر با نام ترانسفورماتور دلخواه شما است.
برای مثال، می‌توانید با ویرایش، مدل پیش‌فرض all-miniLM-L6-v2 را به all-mpnet-base-v2 تغییر دهید:
ترانسفورماتور = 'all-miniLM-L6-v2'
به
ترانسفورماتور = ' all-mpnet-base-v2 '
اینجا جایی است که می‌توانید آن را در برگه Google Collaboratory ویرایش کنید.
یک شکایت رایج در مورد تکرارهای قبلی این اسکریپت این است که منجر به تعداد بالایی از نتایج بدون خوشه می شود.
متأسفانه، همیشه یک عمل متعادل کننده بین دقت خوشه در مقابل تعداد خوشه ها خواهد بود.
تنظیم دقت خوشه بالاتر منجر به تعداد بیشتری از نتایج غیر خوشه ای می شود.
دو متغیر وجود دارد که می تواند به طور مستقیم بر اندازه و دقت همه خوشه ها تأثیر بگذارد:
min_cluster_size
و
دقت خوشه
من پیش فرض 85 (/100) را برای دقت خوشه و حداقل اندازه خوشه 2 تنظیم کرده ام.
در آزمایش، متوجه شدم که این نقطه شیرین است، اما با خیال راحت آزمایش کنید!
در اینجا جایی است که آن متغیرها را در اسکریپت تنظیم کنید.
خودشه! امیدوارم این اسکریپت خوشه بندی کلمات کلیدی برای کار شما مفید باشد.
منابع بیشتر:
تصویر ویژه: گرید گرافیکی/شاتراستاک
خبرنامه روزانه ما را از لورن بیکر بنیانگذار SEJ در مورد آخرین اخبار در صنعت دریافت کنید!
لی فوت بنیانگذار و مدیر Search Solved، یک آژانس SEO متخصص در سئوی سازمانی و تجارت الکترونیک است. او … [بیو کامل را بخوانید]
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.

source
سئو سایت

About mohtavaclick

Check Also

7 روش برای اصلاح محتوای خود برای سئوی بهتر

آیا فرصت های ساده ای را برای بهبود بهینه سازی محتوای خود از دست می …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

قالب وردپرس وردپرس متخصص وردپرس متخصص ووکامرس افزونه وردپرس کابین وردپرس