خوشه بندی کلمات کلیدی معنایی می تواند تحقیقات کلمات کلیدی شما را به سطح بعدی برساند. در اینجا یک اسکریپت پایتون برای کمک به شما در انجام این کار وجود دارد.
خوشهبندی معنایی کلمات کلیدی میتواند به ارتقای تحقیقات کلیدواژه شما به سطح بعدی کمک کند.
در این مقاله، نحوه استفاده از برگه Google Colaboratory را که به طور انحصاری با خوانندگان Search Engine Journal به اشتراک گذاشته شده است، یاد خواهید گرفت.
این مقاله با استفاده از برگه Google Colab، یک نمای سطح بالا از نحوه عملکرد آن در زیر کاپوت و نحوه انجام تنظیمات مطابق با نیازهای خود، شما را راهنمایی می کند.
اما ابتدا، اصلاً چرا کلمات کلیدی را خوشه بندی کنیم؟
در اینجا چند مورد استفاده برای خوشه بندی کلمات کلیدی آورده شده است.
تحقیق سریعتر کلمات کلیدی:
کمپین های جستجوی پولی:
در اینجا نمونهای از اسکریپت است که سوالات مشابه را با هم جمع میکند، که برای یک مقاله عمیق عالی است!
اگر کارهای من را در توییتر دنبال کرده باشید، می دانید که من مدتی است که در حال آزمایش خوشه بندی کلمات کلیدی هستم.
نسخه های قبلی این اسکریپت بر اساس کتابخانه عالی PolyFuzz با استفاده از تطبیق TF-IDF بود.
در حالی که کار انجام میشد، همیشه تعدادی خوشههای سرخراش وجود داشت که احساس میکردم میتوان نتیجه اصلی را بهبود بخشید.
کلماتی که الگوی مشابهی از حروف دارند، حتی اگر از نظر معنایی به هم مرتبط نباشند، خوشهبندی میشوند.
برای مثال، نتوانست کلماتی مانند «دوچرخه» را با «دوچرخه» دسته بندی کند.
نسخه های قبلی اسکریپت مشکلات دیگری نیز داشتند:
چهار ماه به آخرین نسخه که به طور کامل برای استفاده از جاسازی جملات یادگیری عمیق و پیشرفته بازنویسی شده است، به جلو بروید.
برخی از این خوشه های معنایی عالی را بررسی کنید!
توجه داشته باشید که گرم، حرارتی و گرم در یک دسته از کلمات کلیدی قرار دارند؟
یا در مورد، عمده و عمده چطور؟
سگ و داچشوند، کریسمس و کریسمس؟
حتی می تواند کلمات کلیدی را در بیش از صد زبان مختلف دسته بندی کند!
علاوه بر گروه بندی کلمات کلیدی معنایی ، بهبودهای زیر به آخرین نسخه این اسکریپت اضافه شده است.
برای شروع، باید روی این پیوند کلیک کنید و سپس گزینه Open in Colab را مطابق شکل زیر انتخاب کنید.
با انتخاب Runtime > Change Runtime Type ، نوع Runtime را به GPU تغییر دهید.
Runtime > Run all را از پیمایش بالای Google Colaboratory انتخاب کنید (یا فقط Ctrl+F9 را فشار دهید).
هنگامی که از شما خواسته شد یک فایل csv. حاوی ستونی به نام «کلید واژه» آپلود کنید.
خوشه بندی باید نسبتاً سریع باشد، اما در نهایت به تعداد کلمات کلیدی و مدل استفاده شده بستگی دارد.
به طور کلی، شما باید برای 50000 کلمه کلیدی خوب باشید.
اگر خطای Cuda Out of Memory میبینید، سعی میکنید کلمات کلیدی زیادی را همزمان خوشهبندی کنید!
(شایان ذکر است که این اسکریپت به راحتی می تواند آداپتوری برای اجرا در یک ماشین محلی بدون محدودیت Google Colaboratory باشد.)
اسکریپت اجرا می شود و خوشه ها را به فایل اصلی شما به ستون جدیدی به نام Cluster Name اضافه می کند.
نام های خوشه با استفاده از کوتاه ترین طول کلمه کلیدی در خوشه اختصاص داده می شود.
به عنوان مثال، نام خوشه برای گروه کلمات کلیدی زیر به عنوان "جوراب آلپاکا" تنظیم شده است، زیرا کوتاه ترین کلمه کلیدی در خوشه است.
پس از تکمیل خوشهبندی، یک فایل جدید بهطور خودکار ذخیره میشود و دستهبندیشده در یک ستون جدید به فایل اصلی اضافه میشود.
این اسکریپت بر اساس الگوریتم Fast Clustering است و از مدل هایی استفاده می کند که از قبل در مقیاس بر روی مقادیر زیادی داده آموزش دیده اند.
این امر محاسبه روابط معنایی بین کلمات کلیدی را با استفاده از مدل های خارج از قفسه آسان می کند.
(برای استفاده از آن لازم نیست دانشمند داده باشید!)
در واقع، در حالی که من آن را برای کسانی که دوست دارند سرهمبندی و آزمایش کنند، قابل سفارشیسازی کردهام، برخی پیشفرضهای متعادل را انتخاب کردهام که باید برای موارد استفاده بیشتر افراد معقول باشد.
بسته به نیاز، مدلهای مختلف را میتوان در داخل و خارج از اسکریپت تعویض کرد (خوشهبندی سریعتر، پشتیبانی از چند زبان بهتر، عملکرد معنایی بهتر و غیره).
پس از آزمایش های زیاد، با استفاده از ترانسفورماتور تمام MiniLM-L6-v2 که تعادل عالی بین سرعت و دقت را ایجاد کرد، تعادل کامل سرعت و دقت را پیدا کردم.
اگر ترجیح می دهید از مدل خود استفاده کنید، فقط می توانید آزمایش کنید، می توانید مدل از پیش آموزش دیده موجود را با هر یک از مدل های لیست شده در اینجا یا در Hugging Face Model Hub جایگزین کنید.
تعویض در مدل ها به آسانی جایگزینی متغیر با نام ترانسفورماتور دلخواه شما است.
برای مثال، میتوانید با ویرایش، مدل پیشفرض all-miniLM-L6-v2 را به all-mpnet-base-v2 تغییر دهید:
ترانسفورماتور = 'all-miniLM-L6-v2'
به
ترانسفورماتور = ' all-mpnet-base-v2 '
اینجا جایی است که میتوانید آن را در برگه Google Collaboratory ویرایش کنید.
یک شکایت رایج در مورد تکرارهای قبلی این اسکریپت این است که منجر به تعداد بالایی از نتایج بدون خوشه می شود.
متأسفانه، همیشه یک عمل متعادل کننده بین دقت خوشه در مقابل تعداد خوشه ها خواهد بود.
تنظیم دقت خوشه بالاتر منجر به تعداد بیشتری از نتایج غیر خوشه ای می شود.
دو متغیر وجود دارد که می تواند به طور مستقیم بر اندازه و دقت همه خوشه ها تأثیر بگذارد:
min_cluster_size
و
دقت خوشه
من پیش فرض 85 (/100) را برای دقت خوشه و حداقل اندازه خوشه 2 تنظیم کرده ام.
در آزمایش، متوجه شدم که این نقطه شیرین است، اما با خیال راحت آزمایش کنید!
در اینجا جایی است که آن متغیرها را در اسکریپت تنظیم کنید.
خودشه! امیدوارم این اسکریپت خوشه بندی کلمات کلیدی برای کار شما مفید باشد.
منابع بیشتر:
تصویر ویژه: گرید گرافیکی/شاتراستاک
خبرنامه روزانه ما را از لورن بیکر بنیانگذار SEJ در مورد آخرین اخبار در صنعت دریافت کنید!
لی فوت بنیانگذار و مدیر Search Solved است، یک آژانس SEO متخصص در سئوی سازمانی و تجارت الکترونیک. او … [بیو کامل را بخوانید]
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.
برای دریافت آخرین اخبار صنعت در خبرنامه روزانه ما مشترک شوید.
Check Also
7 روش برای اصلاح محتوای خود برای سئوی بهتر
آیا فرصت های ساده ای را برای بهبود بهینه سازی محتوای خود از دست می …