- حقیقتا اینه که لپ تاپ برای مدتی به صورت روشن رها شده بود.
- فن پردازنده خاموش یا تو کم ترین حالت ممکن بود.
- تنظیمات خودکار چرخش هم فن پردازنده هم غیر فعال بود.
- نتیجه این شد که سیستم به صورت خودکار خاموش شد.
- یعنی بعد از گذشت مدتی دیدیم که سیستم خاموش شده خودش.
- در درجه اول باید فهمین که این خاموش شدن سخت افزاری هست یا نرم افزاری
- همراه با این که باید فهمید دلیلش چیه
- برای همین تنها کاری که میشه کرد اینه که فایل های log رو مطالعه کرد.
- من دو فایل زیر رو مطالعه کردم :
/var/log/messages /var/log/syslog
- این فایل ها رو از ته باز می کنم و سعی می کنم به قسمتی برسم که قبل از لود شدن و روشن شدن سیستم هست.
- در آخر به خطوط زیر می رسم :
Mar 24 18:40:33 debian kernel: [13907.104649] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1) Mar 24 18:40:33 debian kernel: [13907.104654] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1) Mar 24 18:40:33 debian kernel: [13907.104656] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1) Mar 24 18:40:33 debian kernel: [13907.104661] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1) Mar 24 18:40:33 debian kernel: [13907.105551] CPU1: Package temperature/speed normal Mar 24 18:40:33 debian kernel: [13907.105552] CPU0: Package temperature/speed normal Mar 24 18:40:33 debian kernel: [13907.105553] CPU2: Package temperature/speed normal Mar 24 18:40:33 debian kernel: [13907.105556] CPU3: Package temperature/speed normal Mar 24 18:41:02 debian kernel: [13936.038953] script.sh (9529): drop_caches: 3 Mar 24 18:41:36 debian kernel: [13970.028992] perf: interrupt took too long (5280 > 5060), lowering kernel.perf_event_max_sample_rate to 37750 Mar 24 18:42:01 debian kernel: [13995.487288] script.sh (9545): drop_caches: 3
- خط ۹ و ۱۱ که چیز خاصی نیست و برای برنامه ای هست که خودم برای رم نوشتم
- خوب همه چیز ظاهرا مشخصه !
- دمای پردازنده رفته بالا و سیستم خاموش شده.
- حالا سوال این جاست که سیستم عامل خودش خودش رو خاموش کرده یا نه سیستم به صورت سخت افزاری خاموش شده
- تنها خطی که میشه ازش استفاده کرد. خط ۱۰ هست.
perf: interrupt took too long (5280 > 5060), lowering kernel.perf_event_max_sample_rate to 37750
- با سرچ کردن توی گوگل ابتدا به این رسیدم :
- This is informational and nothing to worry about. It has to do with the Linux perf tool which is included in the kernel. The kernel automagically determines the sample rate that could be used without impacting system performance too much; and it logs this even when perf isn’t active, or even installed. Messages like this are triggered by high(er) system load or a cpu that is scaling
- با یکم سرچ بیشتر به این رسیدم : (لوکال)
-
This essentially means that the machine was stuck on an interrupt for a long amount of time. This can be caused by a number of reasons, including:
- DISK IO interrupt taking long would be caused by a faulty, slow or overloaded disk. Alternatively this can be caused by an issue with a disk or raid controller.
- Network IO interrupt taking too long would be caused most often by network driver issues being suboptimal. Alternatively, this can be caused by network issues, although the protocol switching should theoretically be preventing it.