តើ​ម៉ាស៊ីន​ដំណើរការ​នុយក្លេអ៊ែរ​ល្អ​ជាង​ប៉ុន្មាន? តើ​ចំនួន​ស្នូល​ដំណើរការ​ប៉ះពាល់​អ្វីខ្លះ? ខួរក្បាលពហុស្នូល

ខ្ញុំបានប្រាប់អ្នកពីមូលហេតុដែលកំណើននៃប្រេកង់ដំណើរការបានជាប់គាំងនៅ gigahertz ជាច្រើន។ ឥឡូវនេះសូមនិយាយអំពីមូលហេតុដែលការអភិវឌ្ឍន៍នៃចំនួនស្នូលនៅក្នុងខួរក្បាលអ្នកប្រើប្រាស់ក៏មានភាពយឺតយ៉ាវផងដែរ៖ ឧទាហរណ៍ ខួរក្បាលប្រភេទ dual-core ស្មោះត្រង់ដំបូង (ដែលស្នូលទាំងពីរស្ថិតនៅក្នុងបន្ទះឈីបតែមួយ) ដែលបង្កើតឡើងនៅលើស្ថាបត្យកម្ម x86 បានបង្ហាញខ្លួនរួចហើយនៅក្នុងឆ្នាំ 2006 កាលពី 12 ឆ្នាំមុន - នេះគឺជាបន្ទាត់ Intel Core Duo ។ ហើយចាប់តាំងពីពេលនោះមក អង្គដំណើរការ 2-core មិនបានចាកចេញពីសង្វៀននោះទេ លើសពីនេះ ពួកគេកំពុងអភិវឌ្ឍយ៉ាងសកម្ម៖ មួយថ្ងៃមុននេះ កុំព្យូទ័រយួរដៃ Lenovo បានចេញមកជាមួយនឹងប្រព័ន្ធដំណើរការដែលបង្កើតឡើងនៅលើបច្ចេកវិទ្យាចុងក្រោយបង្អស់ (សម្រាប់ស្ថាបត្យកម្ម x86) បច្ចេកវិទ្យាដំណើរការ 10 nm ។ ហើយបាទ ដូចដែលអ្នកប្រហែលជាបានទាយ ខួរក្បាលនេះមានស្នូល 2 យ៉ាងពិតប្រាកដ។

សម្រាប់ប្រព័ន្ធដំណើរការអ្នកប្រើប្រាស់ចំនួនស្នូលត្រូវបានជាប់គាំងនៅ 6 ចាប់តាំងពីឆ្នាំ 2010 ជាមួយនឹងការចេញផ្សាយនៃបន្ទាត់ AMD Phenom X6 - បាទ AMD FX មិនស្មោះត្រង់ 8-core processors (មាន 4 APUs) ដូច Ryzen 7 គឺពីរ។ ប្លុក 4 ស្នូលដែលមានទីតាំងនៅចំហៀងនៅលើបន្ទះឈីប។ ហើយនៅទីនេះពិតណាស់សំណួរកើតឡើង - ហេតុអ្វីបានជាដូច្នេះ? យ៉ាងណាមិញ កាតវីដេអូដូចគ្នាដែលសំខាន់គឺ "ក្បាលតែមួយ" (នោះគឺមាន 1 shader) ក្នុងឆ្នាំ 1995-6 បានគ្រប់គ្រងបង្កើនចំនួនរបស់ពួកគេដល់រាប់ពាន់នាក់ឥឡូវនេះ - ឧទាហរណ៍នៅក្នុង Nvidia Titan V មានដូចជា 5120 ក្នុងចំណោមពួកគេ! ក្នុងពេលជាមួយគ្នានេះ ក្នុងរយៈពេលដ៏យូរនៃការអភិវឌ្ឍន៍នៃស្ថាបត្យកម្ម x86 ដំណើរការរបស់អ្នកប្រើប្រាស់បានដោះស្រាយដោយស្មោះត្រង់ 6 cores ក្នុងមួយ chip និង CPU សម្រាប់ PCs ដែលដំណើរការខ្ពស់ - នៅថ្ងៃទី 18 ពោលគឺការបញ្ជាទិញពីរបីដែលមានទំហំតិចជាង។ កាតវីដេអូទាំងនោះ។ ហេតុអ្វី? យើងនឹងនិយាយអំពីរឿងនេះខាងក្រោម។

ស្ថាបត្យកម្ម CPU

ដំបូងឡើយ ប្រព័ន្ធដំណើរការ Intel x86 ទាំងអស់ត្រូវបានបង្កើតឡើងនៅលើស្ថាបត្យកម្ម CISC (Complex Instruction Set Computing, processors with a full ofstruction) - នោះគឺពួកគេបានអនុវត្តចំនួនអតិបរមានៃការណែនាំ "សម្រាប់គ្រប់ឱកាសទាំងអស់"។ ម៉្យាងវិញទៀត នេះគឺអស្ចារ្យណាស់៖ ជាឧទាហរណ៍ ក្នុងទសវត្សរ៍ទី 90 ស៊ីភីយូទទួលខុសត្រូវទាំងការបង្ហាញរូបភាព និងសំឡេង (មានការ hack ជីវិត - ប្រសិនបើហ្គេមយឺត ការបិទសំឡេងនៅក្នុងវាអាចជួយបាន)។ ហើយសូម្បីតែឥឡូវនេះ ខួរក្បាលគឺជាប្រភេទនៃការរួមបញ្ចូលគ្នាដែលអាចធ្វើអ្វីគ្រប់យ៉ាង - ហើយនេះក៏ជាបញ្ហាមួយផងដែរ៖ ការធ្វើប៉ារ៉ាឡែលកិច្ចការចៃដន្យឆ្លងកាត់ស្នូលជាច្រើនមិនមែនជាកិច្ចការតូចតាចនោះទេ។ ចូរនិយាយថាជាមួយនឹងស្នូលពីរ វាអាចត្រូវបានធ្វើយ៉ាងសាមញ្ញ៖ យើង "ព្យួរ" ប្រព័ន្ធ និងកិច្ចការផ្ទៃខាងក្រោយទាំងអស់នៅលើស្នូលមួយ ហើយមានតែកម្មវិធីនៅលើផ្សេងទៀត។ វានឹងដំណើរការជានិច្ច ប៉ុន្តែការកើនឡើងនៃការអនុវត្តនឹងនៅឆ្ងាយពីទ្វេដង ដោយសារដំណើរការផ្ទៃខាងក្រោយជាធម្មតាត្រូវការធនធានតិចជាងកិច្ចការធ្ងន់បច្ចុប្បន្ន។

នៅខាងឆ្វេងគឺជាដ្យាក្រាមនៃ Nvidia GTX 980 Ti GPU ដែលអ្នកអាចមើលឃើញ 2816 CUDA cores រួមបញ្ចូលគ្នាជាចង្កោម។ នៅខាងស្តាំគឺជារូបថតនៃខួរក្បាល AMD Ryzen ដែលស្លាប់ដែលស្នូលចំនួន 4 អាចមើលឃើញ។

ឥឡូវនេះសូមស្រមៃថាយើងមិនមានពីរទេប៉ុន្តែ 4 ឬសូម្បីតែ 8 ស្នូល។ បាទ/ចាស ក្នុងការរក្សាទុកឯកសារ និងកិច្ចការគណនាផ្សេងទៀត ការប៉ារ៉ាឡែលដំណើរការល្អ (ហើយនោះជាមូលហេតុដែលដំណើរការម៉ាស៊ីនមេដូចគ្នាអាចមានស្នូលរាប់សិប)។ ប៉ុន្តែចុះយ៉ាងណាបើយើងមានភារកិច្ចដែលមានលទ្ធផលចៃដន្យ (ដែលភាគច្រើនជាអកុសល) - និយាយថាហ្គេម? យ៉ាងណាមិញ រាល់សកម្មភាពថ្មីទាំងអស់គឺអាស្រ័យទៅលើអ្នកលេងទាំងស្រុង ដូច្នេះ "ការរីករាលដាល" បន្ទុកបែបនេះនៅទូទាំងស្នូលជាច្រើនមិនមែនជាការងារងាយស្រួលនោះទេ នោះហើយជាមូលហេតុដែលអ្នកអភិវឌ្ឍន៍តែងតែ "សរសេរដោយដៃ" នូវអ្វីដែលស្នូលធ្វើ៖ ឧទាហរណ៍ មានតែមនុស្សម្នាក់ប៉ុណ្ណោះអាច ត្រូវបានកាន់កាប់ដោយសកម្មភាពដំណើរការ បញ្ញាសិប្បនិម្មិតមួយទៀតគឺទទួលខុសត្រូវសម្រាប់តែសំឡេងជុំវិញ ហើយដូច្នេះនៅលើ។ វាស្ទើរតែមិនអាចទៅរួចទេក្នុងការផ្ទុកសូម្បីតែខួរក្បាល 8-core តាមរបៀបនេះដែលជាអ្វីដែលយើងឃើញនៅក្នុងការអនុវត្ត។

ជាមួយនឹងកាតវីដេអូ អ្វីគ្រប់យ៉ាងគឺសាមញ្ញជាង: GPU តាមពិតដោះស្រាយជាមួយការគណនា ហើយមានតែពួកវាទេ ហើយចំនួននៃប្រភេទនៃការគណនាមានកំណត់ និងតូច។ ដូច្នេះដំបូង វាអាចបង្កើនប្រសិទ្ធភាពស្នូលកុំព្យូទ័រដោយខ្លួនឯង (Nvidia ហៅពួកគេថា CUDA) ជាពិសេសសម្រាប់កិច្ចការដែលត្រូវការ ហើយទីពីរ ដោយសារកិច្ចការដែលអាចធ្វើបានទាំងអស់ត្រូវបានគេដឹង ដំណើរការនៃការធ្វើប៉ារ៉ាឡែលពួកវាមិនបង្កឱ្យមានការលំបាកទេ។ ហើយទីបី ការគ្រប់គ្រងត្រូវបានអនុវត្តមិនមែនដោយអ្នកដាក់ស្រមោលបុគ្គលនោះទេ ប៉ុន្តែតាមរយៈម៉ូឌុលគណនា ដែលរួមមាន 64-192 shaders ដូច្នេះ លេខធំស្រមោលមិនមែនជាបញ្ហាទេ។

ការប្រើប្រាស់​ថាមពល

ហេតុផលមួយក្នុងចំណោមហេតុផលសម្រាប់ការបោះបង់ចោលការប្រណាំងប្រេកង់បន្ថែមទៀតគឺការកើនឡើងយ៉ាងខ្លាំងនៃការប្រើប្រាស់ថាមពល។ ដូចដែលខ្ញុំបានពន្យល់រួចហើយនៅក្នុងអត្ថបទអំពីការបន្ថយល្បឿននៃការកើនឡើងនៃប្រេកង់ CPU ការរលាយកំដៅនៃខួរក្បាលគឺសមាមាត្រទៅនឹងគូបនៃប្រេកង់។ និយាយម្យ៉ាងទៀតប្រសិនបើនៅប្រេកង់ 2 ​​GHz ខួរក្បាលបង្កើតកំដៅ 100 W ដែលតាមគោលការណ៍អាចដកចេញបានដោយគ្មានបញ្ហាជាមួយម៉ាស៊ីនត្រជាក់បន្ទាប់មកនៅ 4 GHz លទ្ធផលគឺ 800 W រួចហើយដែលអាចយកចេញបាន។ សេណារីយ៉ូករណីល្អបំផុតអង្គជំនុំជម្រះរំហួតជាមួយអាសូតរាវ (ទោះបីជាវាគួរតែត្រូវបានយកទៅក្នុងគណនីថារូបមន្តគឺនៅតែប្រហាក់ប្រហែលហើយខួរក្បាលមិនត្រឹមតែមានស្នូលគណនាប៉ុណ្ណោះទេប៉ុន្តែវាពិតជាអាចធ្វើទៅបានដើម្បីទទួលបានលំដាប់នៃលេខដោយមានជំនួយរបស់វា) ។

ដូច្នេះការបង្កើនទំហំគឺជាដំណោះស្រាយដ៏ល្អមួយ៖ ដូច្នេះនិយាយប្រហែល ខួរក្បាលប្រភេទ dual-core 2 GHz នឹងប្រើប្រាស់ថាមពល 200 W ប៉ុន្តែខួរក្បាល single-core 3 GHz នឹងប្រើប្រាស់ថាមពលជិត 340 W ពោលគឺការកើនឡើងនៃការសាយភាយកំដៅគឺ ច្រើនជាង 50% ខណៈពេលដែលនៅក្នុងកិច្ចការដែលមានការបង្កើនប្រសិទ្ធភាពល្អសម្រាប់ការដំណើរការពហុខ្សែ ស៊ីភីយូ dual-core ប្រេកង់ទាបនឹងនៅតែលឿនជាងប្រេកង់ខ្ពស់ single-core ។


ឧទាហរណ៏នៃអង្គជំនុំជម្រះរំហួតជាមួយអាសូតរាវសម្រាប់ការធ្វើឱ្យត្រជាក់ស៊ីភីយូដែលត្រួតលើគ្នាយ៉ាងខ្លាំង។

វានឹងហាក់បីដូចជាថានេះគឺជា bonanza យើងបង្កើតខួរក្បាល 10-core យ៉ាងឆាប់រហ័សជាមួយនឹងប្រេកង់ 1 GHz ដែលនឹងបង្កើតកំដៅបានត្រឹមតែ 25% ច្រើនជាង CPU single-core ដែលមាន 2 GHz (ប្រសិនបើ processor 2 GHz បង្កើត 100 W នៃកំដៅបន្ទាប់មក 1 GHz - ត្រឹមតែ 12.5 W, 10 cores - ប្រហែល 125 W) ។ ប៉ុន្តែនៅទីនេះយើងប្រញាប់ប្រញាល់ចូលទៅក្នុងការពិតដែលថាមិនមែនគ្រប់កិច្ចការទាំងអស់ត្រូវបានស្របគ្នាល្អនោះទេ ដូច្នេះក្នុងការអនុវត្តវាច្រើនតែបង្ហាញថាស៊ីភីយូ single-core តម្លៃថោកជាងដែលមាន 2 GHz នឹងលឿនជាង CPU 10-core ដែលមានតម្លៃថ្លៃជាងជាមួយ 1 ។ GHz ប៉ុន្តែនៅតែមានដំណើរការបែបនេះ - នៅក្នុងផ្នែកម៉ាស៊ីនមេដែលមិនមានបញ្ហាជាមួយនឹងកិច្ចការស្របគ្នា ហើយស៊ីភីយូ 40-60 ស្នូលដែលមានប្រេកង់ 1.5 GHz ច្រើនដងលឿនជាង 8-10 core processors ដែលមានប្រេកង់។ 4 GHz ខណៈពេលដែលបែងចែកកំដៅបរិមាណប្រៀបធៀប។

ដូច្នេះហើយ ក្រុមហ៊ុនផលិតស៊ីភីយូត្រូវធានាថា ដំណើរការតែមួយខ្សែមិនរងការឈឺចាប់នៅពេលដែលស្នូលកើនឡើង ហើយគិតគូរពីការពិតដែលថាដែនកំណត់នៃការសាយភាយកំដៅនៅក្នុងកុំព្យូទ័រផ្ទះធម្មតាមួយត្រូវបាន "រកឃើញ" តាំងពីយូរយារណាស់មកហើយ (នេះគឺប្រហែល 60 -100 W) មានវិធីដើម្បីបង្កើនចំនួនស្នូលជាមួយនឹងដំណើរការតែមួយស្នូលដូចគ្នា និងការរំសាយកំដៅដូចគ្នា មានជម្រើសពីរប៉ុណ្ណោះ៖ នេះគឺដើម្បីបង្កើនប្រសិទ្ធភាពស្ថាបត្យកម្មខួរក្បាលដោយខ្លួនឯង បង្កើនប្រសិទ្ធភាពរបស់វាក្នុងមួយវដ្តនាឡិកា។ ឬកាត់បន្ថយដំណើរការបច្ចេកទេស។ ប៉ុន្តែ alas, ទាំងពីរកំពុងរីកចម្រើនបន្តិចម្តង ៗ : ជាង 30 ឆ្នាំនៃអត្ថិភាពនៃ x86 processors ស្ទើរតែអ្វីគ្រប់យ៉ាងដែលអាចធ្វើទៅបានត្រូវបាន "ប៉ូឡូញ" រួចហើយ ដូច្នេះការកើនឡើងគឺល្អបំផុត 5% ក្នុងមួយជំនាន់ និងកាត់បន្ថយបច្ចេកទេស។ ដំណើរការកាន់តែពិបាកដោយសារបញ្ហាជាមូលដ្ឋាននៃការបង្កើតត្រង់ស៊ីស្ទ័រដែលដំណើរការបានត្រឹមត្រូវ (ជាមួយនឹងទំហំ ១០ nanometers ឥទ្ធិពល quantum ចាប់ផ្តើមប៉ះពាល់រួចហើយ វាពិបាកក្នុងការផលិតឡាស៊ែរសមរម្យ។ល។) កាន់តែពិបាក។

ទំហំគ្រីស្តាល់

ប្រសិនបើយើងក្រឡេកមើលផ្ទៃដីនៃបន្ទះឈីបដំណើរការកាលពី 15 ឆ្នាំមុន យើងនឹងឃើញថាវាមានត្រឹមតែ 100-150 មិល្លីម៉ែត្រការ៉េប៉ុណ្ណោះ។ ប្រហែល 5-7 ឆ្នាំមុន បន្ទះសៀគ្វី "បានកើនឡើង" ដល់ 300-400 sq mm ហើយ... ដំណើរការបានបញ្ឈប់។ ហេតុអ្វី? អ្វីគ្រប់យ៉ាងគឺសាមញ្ញ - ដំបូងវាពិបាកណាស់ក្នុងការផលិតគ្រីស្តាល់យក្សដែលជាមូលហេតុដែលចំនួននៃពិការភាពកើនឡើងយ៉ាងខ្លាំងហើយដូច្នេះតម្លៃចុងក្រោយនៃស៊ីភីយូ។

ទីពីរ ភាពផុយស្រួយកើនឡើង៖ គ្រីស្តាល់ធំអាចបំបែកបានយ៉ាងងាយ ហើយគែមផ្សេងៗរបស់វាអាចឡើងកំដៅខុសៗគ្នា ដែលអាចធ្វើឱ្យខូចរាងកាយម្តងទៀត។


ការប្រៀបធៀបគ្រីស្តាល់ Intel Pentium 3 និង Core i9 ។

ហើយទីបី ល្បឿននៃពន្លឺក៏ណែនាំការកំណត់របស់វាផងដែរ៖ បាទ ទោះបីជាវាខ្ពស់ក៏ដោយ វាមិនកំណត់ទេ ហើយជាមួយនឹងគ្រីស្តាល់ធំៗ វាអាចណែនាំការពន្យារពេល ឬសូម្បីតែធ្វើឱ្យប្រតិបត្តិការរបស់ខួរក្បាលមិនអាចទៅរួច។

នៅទីបំផុត ទំហំអតិបរមាគ្រីស្តាល់បានឈប់នៅប្រហែល 500 មការ៉េ ហើយទំនងជាមិនលូតលាស់ទៀតទេ - ដូច្នេះដើម្បីបង្កើនចំនួនស្នូល អ្នកត្រូវកាត់បន្ថយទំហំរបស់វា។ វាហាក់ដូចជា Nvidia ឬ AMD អាចធ្វើដូចនេះបាន ហើយ GPU របស់ពួកគេមាន Shaders រាប់ពាន់។ ប៉ុន្តែនៅទីនេះវាគួរតែត្រូវបានយល់ថា Shaders មិនមែនជាស្នូលពេញលេញទេ - ឧទាហរណ៍ពួកគេមិនមានឃ្លាំងសម្ងាត់ផ្ទាល់ខ្លួនរបស់ពួកគេទេប៉ុន្តែគ្រាន់តែជាការរួមមួយបូកនឹង "ការធ្វើឱ្យច្បាស់" សម្រាប់កិច្ចការជាក់លាក់ធ្វើឱ្យវាអាច "បោះចោល" អ្វីគ្រប់យ៉ាងដែលមិនចាំបាច់ពី ពួកវាដែលប៉ះពាល់ដល់ទំហំរបស់ពួកគេ។ ហើយស៊ីភីយូមិនត្រឹមតែមានស្នូលពេញលេញជាមួយនឹងឃ្លាំងសម្ងាត់របស់វាប៉ុណ្ណោះទេ ប៉ុន្តែជាញឹកញាប់ក្រាហ្វិក និងឧបករណ៍បញ្ជាផ្សេងៗមានទីតាំងនៅលើគ្រីស្តាល់ដូចគ្នា - ដូច្នេះនៅទីបញ្ចប់ ជាថ្មីម្តងទៀតស្ទើរតែវិធីតែមួយគត់ដើម្បីបង្កើនចំនួនស្នូលដែលមានទំហំគ្រីស្តាល់ដូចគ្នា គឺជាការបង្កើនប្រសិទ្ធភាពដូចគ្នា និងការកាត់បន្ថយដូចគ្នានៃដំណើរការបច្ចេកទេស ហើយដូចដែលខ្ញុំបានសរសេររួចហើយ ដំណើរការយឺតៗ។

ការបង្កើនប្រសិទ្ធភាពប្រតិបត្តិការ

សាកស្រមៃមើលថា យើងមានក្រុមមនុស្សធ្វើការងារផ្សេងៗ ដែលការងារខ្លះត្រូវការការងារមនុស្សច្រើននាក់ក្នុងពេលតែមួយ។ ប្រសិនបើមានមនុស្សពីរនាក់នៅក្នុងនោះ ពួកគេនឹងអាចយល់ព្រម និងធ្វើការប្រកបដោយប្រសិទ្ធភាព។ បួនគឺពិបាកជាង ប៉ុន្តែការងារក៏នឹងមានប្រសិទ្ធភាពផងដែរ។ ចុះ​បើ​មាន​១០ ឬ​២០​នាក់? នៅទីនេះយើងត្រូវការមធ្យោបាយទំនាក់ទំនងមួយចំនួនរវាងពួកគេរួចហើយ បើមិនដូច្នេះទេវានឹងមាន "ការបង្ខូចទ្រង់ទ្រាយ" នៅក្នុងការងារ នៅពេលដែលនរណាម្នាក់មិនរវល់ជាមួយអ្វីទាំងអស់។ នៅក្នុងប្រព័ន្ធដំណើរការ Intel មធ្យោបាយទំនាក់ទំនងនេះគឺជា ring bus ដែលភ្ជាប់ស្នូលទាំងអស់ និងអនុញ្ញាតឱ្យពួកគេផ្លាស់ប្តូរព័ត៌មានគ្នាទៅវិញទៅមក។

ប៉ុន្តែទោះបីជាវាមិនអាចជួយបានទេ: ឧទាហរណ៍នៅប្រេកង់ដូចគ្នាប្រព័ន្ធដំណើរការ Intel 10-core និង 18-core នៃជំនាន់ Skylake-X ខុសគ្នាក្នុងការអនុវត្តត្រឹមតែ 25-30% ទោះបីជាតាមទ្រឹស្តីពួកគេគួរតែមានរហូតដល់ 80 ក៏ដោយ។ % មូលហេតុគឺឡានក្រុង - មិនថាវាល្អប៉ុណ្ណាទេ វានៅតែមានការពន្យាពេល និងពេលវេលារងចាំ ហើយស្នូលកាន់តែច្រើន ស្ថានភាពកាន់តែអាក្រក់ទៅៗ។ ប៉ុន្តែហេតុអ្វីបានជាមិនមានបញ្ហាបែបនេះនៅក្នុងកាតវីដេអូ? វាសាមញ្ញ - ប្រសិនបើស្នូលខួរក្បាលអាចត្រូវបានគេគិតថាជាមនុស្សដែលអាចបំពេញការងារផ្សេងៗបាននោះ ឯកតាកុំព្យូទ័រនៃកាតវីដេអូគឺដូចជាមនុស្សយន្តនៅលើបន្ទាត់ដំឡើងដែលអាចអនុវត្តបានតែការណែនាំជាក់លាក់ប៉ុណ្ណោះ។ ពួកគេមិនចាំបាច់ "យល់ព្រម" ទេ - ដូច្នេះនៅពេលដែលចំនួនរបស់ពួកគេកើនឡើង ប្រសិទ្ធភាពថយចុះកាន់តែយឺត៖ ឧទាហរណ៍ ភាពខុសគ្នានៅក្នុង CUDA រវាង 1080 (2560 units) និង 1080 Ti (3584 units) គឺ 40% នៅក្នុងការអនុវត្ត។ វាគឺប្រហែល 25-35% បន្ទាប់មកមានការខាតបង់តិចជាងគួរឱ្យកត់សម្គាល់។


ស្នូលកាន់តែច្រើន កាន់តែអាក្រក់ពួកគេធ្វើការជាមួយគ្នា រហូតដល់សូន្យដំណើរការកើនឡើង នៅពេលដែលចំនួនស្នូលកើនឡើង។

ដូច្នេះមិនមានចំណុចជាក់លាក់ណាមួយក្នុងការបង្កើនចំនួនស្នូលទេ - ការកើនឡើងពីស្នូលថ្មីនីមួយៗនឹងទាបជាង និងទាបជាង។ លើសពីនេះទៅទៀត វាពិតជាលំបាកណាស់ក្នុងការដោះស្រាយបញ្ហានេះ - អ្នកត្រូវបង្កើត Bus ដែលនឹងអនុញ្ញាតឱ្យផ្ទេរទិន្នន័យរវាងស្នូលទាំងពីរជាមួយនឹងការពន្យាពេលដូចគ្នា។ topology ផ្កាយគឺសមស្របបំផុតក្នុងករណីនេះ - នៅពេលដែលស្នូលទាំងអស់គួរតែត្រូវបានភ្ជាប់ទៅ hub ប៉ុន្តែតាមពិតគ្មាននរណាម្នាក់បានធ្វើការអនុវត្តបែបនេះទេ។

ដូច្នេះនៅទីបញ្ចប់ ដូចដែលយើងឃើញ ការបង្កើនប្រេកង់ និងការបង្កើនចំនួនស្នូល គឺជាកិច្ចការដ៏លំបាកមួយ ហើយហ្គេមនេះច្រើនតែមិនមានតម្លៃដល់ទៀននោះទេ។ ហើយនៅពេលអនាគតដ៏ខ្លីខាងមុខនេះ វាមិនទំនងថានឹងមានការផ្លាស់ប្តូរអ្វីធ្ងន់ធ្ងរនោះទេ ព្រោះថាគ្មានអ្វីប្រសើរជាងគ្រីស្តាល់ស៊ីលីកុនមិនទាន់ត្រូវបានបង្កើតនៅឡើយ។

ជំរាបសួរអ្នកទាំងអស់គ្នា មានការជជែកគ្នាក្នុងចិត្តអ្នកប្រើប្រាស់យូរមកហើយ តើមួយណាល្អជាង ប្រេកង់ខ្ពស់ ឬចំនួនស្នូល? ឥឡូវនេះមាន processors ជាច្រើន ហើយពួកវាខុសគ្នាជាចម្បងទាំងចំនួនស្នូល និងប្រេកង់ ឬទាំងអស់នៅពេលតែមួយ ដូច្នេះដើម្បីនិយាយ។ ព្រោះ​ចំណុច​ទាំង​ពីរ​នេះ​ជា​កត្តា​ចម្បង​ដែល​ប៉ះពាល់​ដល់​ផលិតភាព។

ដូច្នេះមើល ខ្ញុំសូមបង្ហាញជាឧទាហរណ៍មួយថា ហេតុអ្វីបានជាពេលខ្លះ cores ច្រើនល្អជាង ហើយពេលខ្លះប្រេកង់ខ្ពស់គឺល្អជាង។ ជាឧទាហរណ៍ សូមក្រឡេកមើលកុំព្យូទ័រការិយាល័យ ដែលពួកគេបង្កើត និងកែសម្រួលឯកសារ ប្រើប្រាស់អ៊ីនធឺណិត និងកម្មវិធីរុករកតាមអ៊ីនធឺណិត។ ទាំង​នេះ​មិន​មែន​ជា​កិច្ចការ​ដែល​ទាមទារ​ពិសេស​នោះ​ទេ ប៉ុន្តែ​សម្រាប់​ការ​លួង​លោម​វា​ល្អ​ជាង​ដែល​កិច្ចការ​ទាំង​អស់​នេះ​ដំណើរការ​បាន​លឿន។ បាទ/ចាស នៅទីនេះអ្នកអាចយកឧទាហរណ៍ ខួរក្បាល Core i5 ហើយវានឹងនៅតែដំណើរការបានយ៉ាងលឿន។ ប៉ុន្តែខ្ញុំនឹងយក Pentium G3258 នៅទីនេះ (នេះគ្រាន់តែជាឧទាហរណ៍មួយ) នេះគឺជា Penek វាមានស្នូលពីរ ហើយអាចធ្វើការ Overclock បានយ៉ាងល្អ។ ប៉ុន្តែវាមានតម្លៃតិចជាង i5 ។ អ្នកអាច Overclock វាដល់ 4.4 GHz ដែលជាការ Overclock ប្រកបដោយសុវត្ថិភាព ដូច្នេះដើម្បីនិយាយ។ ហើយស្នូលទាំងពីរនេះនៅ 4.4 GHz នឹងអនុញ្ញាតឱ្យអ្នកទទួលបានកុំព្យូទ័រដែលមានល្បឿនលឿនគួរសម។ ហើយប្រសិនបើអ្នក overclock វាដល់ 4.6 GHz វាកាន់តែល្អជាង។ ក្នុងពេលជាមួយគ្នានេះ អង្គដំណើរការមិនឡើងកំដៅខ្លាំងទេ ប៉ុន្តែជាការពិតណាស់ ឧបករណ៍កម្តៅល្អគឺចាំបាច់។

ប្រភេទនៃការ Overclock នៃ Pentium G3258 នេះនឹងមានភាពយុត្តិធម៌ទាំងតម្លៃ និងដំណើរការ

ឥឡូវ​នេះ​សូម​លើក​យក​ហ្គេម​ដែល​ពេញ​ចិត្ត​ទាំង​អស់​គ្នា។ តើអ្នកឧស្សាហ៍លេងហ្គេមច្រើនក្នុងពេលតែមួយទេ? ខ្ញុំគិតថាមិនមែនទេ។ ដូច្នេះនៅក្នុង បរិមាណដ៏ច្រើន។មិនមានចំណុចនៅក្នុងស្នូលទេ។ ប៉ុន្តែម្យ៉ាងវិញទៀតស្នូលពីរនឹងមិនគ្រប់គ្រាន់ទេ។ នៅទីនេះ មធ្យមភាគមាសដ៏ល្អគឺ 4 cores យើងមានប្រព័ន្ធដំណើរការ i5 ខ្ញុំមានន័យថានេះសម្រាប់កុំព្យូទ័រស្ថានី ពីព្រោះកុំព្យូទ័រយួរដៃ i5 អាចមានទាំង 2 cores និង 4 threads ឬគ្រាន់តែ 4 cores ប៉ុន្តែ processors របស់ laptop គឺពិតជាខ្សោយជាង។ សម្រាប់ហ្គេម ល្អបំផុតគឺ 4 cores នៅប្រេកង់ខ្ពស់ យ៉ាងហោចណាស់ 4.2 GHz វាគ្រប់គ្រាន់ហើយសម្រាប់ពីរបីឆ្នាំខាងមុខ ដូចដែលវាហាក់ដូចជាខ្ញុំ។ ជាការប្រសើរណាស់, ប្រហែលបីឆ្នាំដែលប្រាកដ។ i7 គឺស្ទើរតែដូចគ្នាប៉ុន្តែ WEADER នៅក្នុងថាមពល។ អ្នកឃើញ។ មិនលឿនជាងនេះទេ ប៉ុន្តែ WIDER មានន័យថា វានឹងអាចទាញអ្វីផ្សេងក្រៅពីហ្គេម ឧទាហរណ៍ ហ្គេមទីពីរ ប្រសិនបើអ្នកមានតែមួយ ហើយលេងហ្គេមពីរក្នុងពេលតែមួយ។.

នៅតែមានពេលបែបនេះ។ ទាក់ទងនឹងប្រេកង់ខ្ពស់ និងស្នូលពីរ ហើយហេតុអ្វីបានជាវាប្រសើរជាងសម្រាប់កុំព្យូទ័រការិយាល័យ។ តើ​អ្នក​ប្រាកដ​ថា​កម្មវិធី​របស់​អ្នក​ទាំង​អស់​អាច​ដំណើរ​ការ​ក្នុង​ទម្រង់​ multithreaded? ហើយ​តើ​ពួកគេ​ត្រូវ​បាន​ធ្វើ​ឱ្យ​ប្រសើរ​ប៉ុណ្ណា​សម្រាប់​របៀប​នេះ? ជាការប្រសើរណាស់, អ្វីដែលខ្ញុំអាចនិយាយបានថាកម្មវិធីជាច្រើនដំណើរការបានយ៉ាងល្អនៅក្នុងរបៀបពហុខ្សែ, កម្មវិធីចាស់ពិតណាស់ដំណើរការកាន់តែអាក្រក់។ ប៉ុន្តែអ្វីដែលគេអាចនិយាយបាន កម្មវិធីដែលមិនធ្វើឱ្យប្រសើរនឹងដំណើរការល្អបំផុតនៅលើស្នូលពីរដែលមានថាមពលខ្លាំងជាងនៅលើ 4 ដែលមានប្រេកង់មិនខ្ពស់ជាពិសេសឧទាហរណ៍ 3 GHz ។ នេះ​ក៏​ជា​ពេល​មួយ​ដែរ យក​វា​ទៅ​ក្នុង​គណនី​ប្រសិន​បើ​អ្នក​ជ្រើស​រើស​ប្រព័ន្ធ​ដំណើរការ។ ដូច្នេះសម្រាប់កុំព្យួទ័រការិយាល័យដែលល្ងង់ ខ្ញុំនឹងយកប្រព័ន្ធដំណើរការ dual-core ជាមួយនឹងមេគុណដោះសោ ដូច្នេះខ្ញុំអាច overclock វាបានយ៉ាងល្អនៅពេលក្រោយ។

ជាទូទៅ វាហាក់ដូចជាខ្ញុំថា i7 គឺសមរម្យជាងមិនមែនសម្រាប់ហ្គេមនោះទេ ប៉ុន្តែសម្រាប់ការងារដែលពឹងផ្អែកខ្លាំងលើធនធានមួយចំនួនទៀត។ ជាឧទាហរណ៍ ដំណើរការវីដេអូ គ្រប់ប្រភេទនៃកម្មវិធី Photoshop បំលែងអ្វីមួយ... វាក៏ល្អសម្រាប់ហ្គេមផងដែរ ដោយមិនសង្ស័យអំពីវា ហើយប្រសិនបើអ្នកចង់យក processor ដែលមានថាមពលបម្រុងល្អ នោះជាការប្រសើរក្នុងការទទួលយក។ i7 (ប៉ុន្តែវាពិតជាមិនថោកទេ)។

មែនហើយ បុរសៗ នោះហើយជាទាំងអស់ ខ្ញុំសង្ឃឹមថាខ្ញុំអាចបង្ហាញគំនិតរបស់ខ្ញុំទៅកាន់អ្នក ហើយថាអ្វីគ្រប់យ៉ាងគឺច្បាស់សម្រាប់អ្នក។ សូមសំណាងល្អចំពោះអ្នកហើយសូមឱ្យអ្នកមានអារម្មណ៍ល្អជានិច្ច

17.11.2016
  • ការបង្រៀន

នៅក្នុងអត្ថបទនេះ ខ្ញុំនឹងព្យាយាមរៀបរាប់អំពីវាក្យសព្ទដែលប្រើដើម្បីពិពណ៌នាអំពីប្រព័ន្ធដែលមានសមត្ថភាពប្រតិបត្តិកម្មវិធីជាច្រើនស្របគ្នា ពោលគឺពហុស្នូល ពហុដំណើរការ ពហុខ្សែ។ ប្រភេទផ្សេងគ្នានៃភាពស្របគ្នានៅក្នុងស៊ីភីយូ IA-32 បានបង្ហាញខ្លួននៅក្នុង ពេលវេលាខុសគ្នាហើយនៅក្នុងលំដាប់មិនស៊ីសង្វាក់បន្តិច។ វាងាយស្រួលណាស់ក្នុងការយល់ច្រលំនៅក្នុងរឿងទាំងអស់នេះ ជាពិសេសការពិចារណាថាប្រព័ន្ធប្រតិបត្តិការដោយប្រុងប្រយ័ត្នលាក់ព័ត៌មានលម្អិតពីកម្មវិធីកម្មវិធីដែលមិនសូវស្មុគ្រស្មាញ។

គោលបំណងនៃអត្ថបទគឺដើម្បីបង្ហាញថាជាមួយនឹងភាពខុសគ្នានៃការកំណត់រចនាសម្ព័ន្ធដែលអាចធ្វើបាននៃប្រព័ន្ធ multiprocessor, multi-core និង multi-threaded systems សម្រាប់កម្មវិធីដែលដំណើរការលើពួកវា ឱកាសត្រូវបានបង្កើតឡើងទាំងសម្រាប់ abstraction (មិនអើពើនឹងភាពខុសគ្នា) និងសម្រាប់យកទៅក្នុងគណនីជាក់លាក់។ (សមត្ថភាពក្នុងការស្វែងរកការកំណត់រចនាសម្ព័ន្ធតាមកម្មវិធី) ។

ការព្រមានអំពី ®, សញ្ញា ™ នៅក្នុងអត្ថបទ

មីនពន្យល់ពីមូលហេតុដែលបុគ្គលិកក្រុមហ៊ុនគួរប្រើការជូនដំណឹងអំពីការរក្សាសិទ្ធិក្នុងការទំនាក់ទំនងសាធារណៈ។ នៅក្នុងអត្ថបទនេះខ្ញុំត្រូវប្រើពួកវាជាញឹកញាប់។

ស៊ីភីយូ

ជា​ការ​ពិត​ណាស់ ពាក្យ​ចាស់​បំផុត​ដែល​គេ​ប្រើ​ញឹកញាប់​បំផុត​និង​ចម្រូងចម្រាស​គឺ "processor"។

IN ពិភពលោកទំនើបខួរក្បាលគឺជាអ្វីដែលយើងទិញនៅក្នុងប្រអប់លក់រាយដ៏ស្រស់ស្អាត ឬកញ្ចប់ OEM ដែលមិនស្អាត។ ធាតុដែលមិនអាចបំបែកបានដែលបានបញ្ចូលទៅក្នុងរន្ធនៅលើ motherboard ។ ទោះបីជាមិនមានឧបករណ៍ភ្ជាប់ក៏ដោយ ហើយវាមិនអាចត្រូវបានដកចេញ នោះគឺប្រសិនបើវាត្រូវបាន soldered យ៉ាងតឹង វាគឺជាបន្ទះឈីបមួយ។

ប្រព័ន្ធទូរស័ព្ទចល័ត (ទូរស័ព្ទ ថេប្លេត កុំព្យូទ័រយួរដៃ) និងកុំព្យូទ័រលើតុភាគច្រើនមានខួរក្បាលតែមួយ។ ស្ថានីយការងារ និងម៉ាស៊ីនមេ ពេលខ្លះមានដំណើរការពីរ ឬច្រើននៅលើ motherboard តែមួយ។

ការគាំទ្រស៊ីភីយូច្រើននៅក្នុងប្រព័ន្ធតែមួយតម្រូវឱ្យមានការផ្លាស់ប្តូរការរចនាជាច្រើន។ យ៉ាងហោចណាស់ វាចាំបាច់ដើម្បីធានាបាននូវការតភ្ជាប់រាងកាយរបស់ពួកគេ (ផ្តល់រន្ធជាច្រើននៅលើ motherboard) ដោះស្រាយបញ្ហានៃការកំណត់អត្តសញ្ញាណរបស់ខួរក្បាល (សូមមើលនៅពេលក្រោយក្នុងអត្ថបទនេះ ក៏ដូចជាកំណត់ចំណាំរបស់ខ្ញុំ) ការសម្របសម្រួលនៃការចូលប្រើអង្គចងចាំ និងការបញ្ជូនរំខាន (ការរំខាន។ ឧបករណ៍បញ្ជាត្រូវតែអាចបញ្ជូនការរំខានទៅកាន់ processors ជាច្រើន) ហើយជាការពិតណាស់ ការគាំទ្រពីប្រព័ន្ធប្រតិបត្តិការ។ ជាអកុសល ខ្ញុំមិនអាចស្វែងរកឯកសារនិយាយអំពីការបង្កើតប្រព័ន្ធពហុដំណើរការដំបូងនៅលើប្រព័ន្ធដំណើរការ Intel ប៉ុន្តែ Wikipedia អះអាងថា Sequent Computer Systems បានផ្គត់ផ្គង់ពួកគេរួចហើយនៅក្នុងឆ្នាំ 1987 ដោយប្រើ Intel 80386 processors ដែលគាំទ្រសម្រាប់បន្ទះឈីបជាច្រើននៅក្នុងប្រព័ន្ធមួយកំពុងរីករាលដាល។ ចាប់ផ្តើមជាមួយ Intel® Pentium ។

ប្រសិនបើមាន processor ជាច្រើន នោះពួកវានីមួយៗមានឧបករណ៍ភ្ជាប់ផ្ទាល់ខ្លួននៅលើក្តារ។ ពួកវានីមួយៗមានច្បាប់ចម្លងឯករាជ្យពេញលេញនៃធនធានទាំងអស់ ដូចជាការចុះឈ្មោះ ឧបករណ៍ប្រតិបត្តិ ឃ្លាំងសម្ងាត់។ ពួកគេចែករំលែកអង្គចងចាំធម្មតា - RAM ។ ការចងចាំអាចភ្ជាប់ជាមួយពួកគេតាមវិធីផ្សេងៗ និងមិនមែនជារឿងតូចតាច ប៉ុន្តែនេះគឺជារឿងដាច់ដោយឡែកដែលលើសពីវិសាលភាពនៃអត្ថបទនេះ។ រឿងសំខាន់គឺថាក្នុងករណីណាក៏ដោយការបំភាន់នៃអង្គចងចាំដែលបានចែករំលែកដូចគ្នាដែលអាចចូលប្រើបានពីដំណើរការទាំងអស់ដែលមាននៅក្នុងប្រព័ន្ធគួរតែត្រូវបានបង្កើតសម្រាប់កម្មវិធីដែលអាចប្រតិបត្តិបាន។


ត្រៀម​ខ្លួន​សម្រាប់​ការ​ហោះ​ហើរ​! បន្ទះកុំព្យូទ័រ Intel® D5400XS

ស្នូល

ជាប្រវត្តិសាស្ត្រ ពហុស្នូលនៅក្នុង Intel IA-32 បានបង្ហាញខ្លួននៅពេលក្រោយជាង Intel® HyperThreading ប៉ុន្តែតាមឋានានុក្រមតក្កវិជ្ជាវាមកបន្ទាប់ទៀត។

វាហាក់ដូចជាថា ប្រសិនបើប្រព័ន្ធមួយមាន processors ច្រើន នោះដំណើរការរបស់វាខ្ពស់ជាង (លើកិច្ចការដែលអាចប្រើប្រាស់ធនធានទាំងអស់)។ ទោះយ៉ាងណាក៏ដោយ ប្រសិនបើតម្លៃនៃការទំនាក់ទំនងរវាងពួកគេខ្ពស់ពេកនោះ ផលចំណេញទាំងអស់ពីការប៉ារ៉ាឡែលត្រូវបានសម្លាប់ដោយការពន្យារពេលយូរសម្រាប់ការផ្ទេរទិន្នន័យទូទៅ។ នេះពិតជាអ្វីដែលត្រូវបានគេសង្កេតឃើញនៅក្នុងប្រព័ន្ធពហុដំណើរការ - ទាំងរូបវិទ្យា និងឡូជីខល ពួកគេនៅឆ្ងាយពីគ្នាទៅវិញទៅមក។ សម្រាប់ការទំនាក់ទំនងប្រកបដោយប្រសិទ្ធភាពក្នុងលក្ខខណ្ឌបែបនេះ ចាំបាច់ត្រូវមកជាមួយឡានក្រុងឯកទេស ដូចជា Intel® QuickPath Interconnect ជាដើម។ ការប្រើប្រាស់ថាមពល ទំហំ និងតម្លៃនៃដំណោះស្រាយចុងក្រោយ ពិតណាស់មិនត្រូវបានកាត់បន្ថយដោយទាំងអស់នេះទេ។ ការរួមបញ្ចូលខ្ពស់នៃសមាសធាតុគួរតែមកជួយសង្គ្រោះ - សៀគ្វីដំណើរការផ្នែកនៃកម្មវិធីប៉ារ៉ាឡែលត្រូវតែត្រូវបាននាំយកមក មិត្តជិតស្និទ្ធទៅមិត្តម្នាក់ និយមសម្រាប់គ្រីស្តាល់មួយ។ នៅក្នុងពាក្យផ្សេងទៀត processor មួយគួរតែរៀបចំជាច្រើន។ ស្នូលដូចគ្នាបេះបិទក្នុងអ្វីៗគ្រប់យ៉ាង ប៉ុន្តែធ្វើការដោយឯករាជ្យ។

ប្រព័ន្ធដំណើរការពហុស្នូល IA-32 ដំបូងបង្អស់ពី Intel ត្រូវបានណែនាំក្នុងឆ្នាំ 2005 ។ ចាប់តាំងពីពេលនោះមក ចំនួនមធ្យមនៃស្នូលនៅក្នុងម៉ាស៊ីនមេ កុំព្យូទ័រលើតុ និងឥឡូវនេះ វេទិកាចល័តកំពុងកើនឡើងជាលំដាប់។

មិនដូចប្រព័ន្ធដំណើរការ single-core ពីរនៅលើប្រព័ន្ធតែមួយដែលចែករំលែកតែ memory ស្នូលពីរក៏អាចចែករំលែកឃ្លាំងសម្ងាត់ និងធនធានដែលទាក់ទងនឹងអង្គចងចាំផ្សេងទៀត។ ភាគច្រើនជាញឹកញាប់ ឃ្លាំងសម្ងាត់កម្រិតទីមួយនៅតែឯកជន (ស្នូលនីមួយៗមានរបស់វា) ខណៈដែលកម្រិតទីពីរ និងទីបីអាចចែករំលែក ឬដាច់ដោយឡែក។ ស្ថាប័នប្រព័ន្ធនេះអនុញ្ញាតឱ្យអ្នកកាត់បន្ថយការពន្យាពេលនៃការដឹកជញ្ជូនទិន្នន័យរវាងស្នូលជិតខាង ជាពិសេសប្រសិនបើពួកគេកំពុងធ្វើការលើកិច្ចការទូទៅមួយ។


មីក្រូក្រាហ្វនៃខួរក្បាល Intel quad-core ដែលមានឈ្មោះថា Nehalem ។ ស្នូលដាច់ដោយឡែក ឃ្លាំងសម្ងាត់កម្រិតទីបីធម្មតា ក៏ដូចជាតំណភ្ជាប់ QPI ទៅកាន់ដំណើរការផ្សេងទៀត និងឧបករណ៍បញ្ជាអង្គចងចាំទូទៅត្រូវបានបម្រុងទុក។

Hyperthread

រហូតមកដល់ឆ្នាំ 2002 មធ្យោបាយតែមួយគត់ដើម្បីទទួលបានប្រព័ន្ធ IA-32 ដែលមានសមត្ថភាពដំណើរការកម្មវិធីពីរ ឬច្រើនស្របគ្នាគឺត្រូវប្រើប្រព័ន្ធដំណើរការពហុដំណើរការ។ Intel® Pentium® 4 ក៏ដូចជាខ្សែ Xeon ដែលមានឈ្មោះកូដ Foster (Netburst) បានណែនាំបច្ចេកវិទ្យាថ្មី - hyperthreads ឬ hyperthreads - Intel® HyperThreading (តទៅនេះ HT) ។

មិនមានអ្វីថ្មីនៅក្រោមព្រះអាទិត្យទេ។ HT គឺ​ជា​ករណី​ពិសេស​នៃ​អ្វី​ដែល​ត្រូវ​បាន​គេ​សំដៅ​ទៅ​ក្នុង​អក្សរសិល្ប៍​ថា​ជា​ការ​ផ្សព្វ​ផ្សាយ​ច្រើន​ដំណាលគ្នា (SMT)។ មិនដូចស្នូល "ពិត" ដែលជាច្បាប់ចម្លងពេញលេញ និងឯករាជ្យ ក្នុងករណី HT មានតែផ្នែកនៃថ្នាំងខាងក្នុងដែលទទួលខុសត្រូវជាចម្បងសម្រាប់ការរក្សាទុកស្ថានភាពស្ថាបត្យកម្ម - ការចុះឈ្មោះត្រូវបានចម្លងនៅក្នុងខួរក្បាលតែមួយ។ ថ្នាំងប្រតិបត្តិដែលទទួលខុសត្រូវក្នុងការរៀបចំ និងដំណើរការទិន្នន័យនៅតែជាឯកវចនៈ ហើយនៅពេលណាមួយត្រូវបានប្រើប្រាស់ដោយភាគច្រើននៃខ្សែស្រឡាយ។ ដូចស្នូលដែរ hyperthreads ចែករំលែកឃ្លាំងសម្ងាត់ ប៉ុន្តែពីកម្រិតណាអាស្រ័យលើប្រព័ន្ធជាក់លាក់។

ខ្ញុំនឹងមិនព្យាយាមពន្យល់ពីគុណសម្បត្តិ និងគុណវិបត្តិទាំងអស់នៃការរចនា SMT ជាទូទៅ និងការរចនា HT ជាពិសេសនោះទេ។ អ្នកអានដែលចាប់អារម្មណ៍អាចស្វែងរកការពិភាក្សាលម្អិតអំពីបច្ចេកវិទ្យានៅក្នុងប្រភពជាច្រើន ហើយពិតណាស់នៅលើវិគីភីឌា។ ទោះជាយ៉ាងណាក៏ដោយខ្ញុំនឹងកត់សម្គាល់ចំណុចសំខាន់ខាងក្រោមដែលពន្យល់ពីការរឹតបន្តឹងបច្ចុប្បន្នលើចំនួន hyperthreads នៅក្នុងផលិតផលពិត។

ការរឹតបន្តឹងខ្សែស្រឡាយ
តើក្នុងករណីណាដែលវត្តមានរបស់ពហុស្នូល "អយុត្តិធម៌" នៅក្នុងទម្រង់នៃ HT មានភាពយុត្តិធម៌? ប្រសិនបើខ្សែស្រឡាយកម្មវិធីមួយមិនអាចផ្ទុកថ្នាំងប្រតិបត្តិទាំងអស់នៅខាងក្នុងខឺណែលទេ នោះពួកវាអាចត្រូវបាន "ខ្ចី" ទៅខ្សែស្រឡាយផ្សេងទៀត។ នេះគឺជាតួយ៉ាងសម្រាប់កម្មវិធីដែលមានបញ្ហាមិនដំណើរការក្នុងការគណនា ប៉ុន្តែនៅក្នុងការចូលប្រើទិន្នន័យ នោះគឺជាញឹកញាប់បង្កើតឃ្លាំងសម្ងាត់ដែលខកខាន ហើយត្រូវរង់ចាំទិន្នន័យដែលត្រូវបញ្ជូនពីអង្គចងចាំ។ ក្នុងអំឡុងពេលនេះ ស្នូលដែលគ្មាន HT នឹងត្រូវបានបង្ខំឱ្យទំនេរ។ វត្តមានរបស់ HT អនុញ្ញាតឱ្យអ្នកប្តូរថ្នាំងប្រតិបត្តិដោយឥតគិតថ្លៃទៅស្ថានភាពស្ថាបត្យកម្មមួយផ្សេងទៀតបានយ៉ាងឆាប់រហ័ស (ចាប់តាំងពីវាត្រូវបានចម្លង) និងប្រតិបត្តិការណែនាំរបស់វា។ នេះគឺជាករណីពិសេសនៃបច្ចេកទេសដែលហៅថា latency hiding នៅពេលដែលប្រតិបត្តិការដ៏វែងមួយ ក្នុងអំឡុងពេលដែលធនធានមានប្រយោជន៍ត្រូវបានទុកចោល ត្រូវបានបិទបាំងដោយការប្រតិបត្តិស្របគ្នានៃកិច្ចការផ្សេងទៀត។ ប្រសិនបើកម្មវិធីមានកម្រិតខ្ពស់នៃការប្រើប្រាស់ធនធានខឺណែលរួចហើយ វត្តមានរបស់ Hyperthreads នឹងមិនអនុញ្ញាតឱ្យមានការបង្កើនល្បឿនទេ - ខឺណែល "ស្មោះត្រង់" គឺត្រូវការនៅទីនេះ។

សេណារីយ៉ូធម្មតាសម្រាប់កម្មវិធីកុំព្យូទ័រ និងម៉ាស៊ីនមេដែលត្រូវបានរចនាឡើងសម្រាប់ស្ថាបត្យកម្មម៉ាស៊ីនដែលមានគោលបំណងទូទៅមានសក្តានុពលសម្រាប់ភាពស្របគ្នាដែលត្រូវបានអនុវត្តដោយប្រើ HT ។ ទោះជាយ៉ាងណាក៏ដោយ សក្ដានុពលនេះកំពុងត្រូវបានប្រើប្រាស់យ៉ាងឆាប់រហ័ស។ ប្រហែលជាដោយសារហេតុផលនេះ ស្ទើរតែទាំងអស់ IA-32 processor ចំនួននៃ hardware hyperthreads មិនលើសពីពីរទេ។ នៅក្នុងសេណារីយ៉ូធម្មតា ការទទួលបានពីការប្រើប្រាស់ Hyperthreads បី ឬច្រើននឹងមានតិចតួច ប៉ុន្តែការបាត់បង់ទំហំស្លាប់ ការប្រើប្រាស់ថាមពល និងការចំណាយរបស់វាមានសារៈសំខាន់ណាស់។

ស្ថានភាពផ្សេងគ្នាត្រូវបានសង្កេតឃើញនៅក្នុងកិច្ចការធម្មតាដែលត្រូវបានអនុវត្តនៅលើឧបករណ៍បង្កើនល្បឿនវីដេអូ។ ដូច្នេះស្ថាបត្យកម្មទាំងនេះត្រូវបានកំណត់លក្ខណៈដោយការប្រើប្រាស់បច្ចេកវិទ្យា SMT ជាមួយនឹងចំនួនខ្សែស្រលាយធំជាង។ ចាប់តាំងពី Intel® Xeon Phi coprocessors (ណែនាំក្នុងឆ្នាំ 2010) មានមនោគមវិជ្ជា និងតំណពូជយ៉ាងជិតស្និទ្ធទៅនឹងកាតវីដេអូ ពួកគេអាចមាន បួន hyperthreading នៅលើស្នូលនីមួយៗ - ការកំណត់រចនាសម្ព័ន្ធតែមួយគត់ចំពោះ IA-32 ។

ដំណើរការឡូជីខល

ក្នុងចំណោម "កម្រិត" ដែលបានពិពណ៌នាទាំងបីនៃភាពស្របគ្នា (processors, cores, hyperthreads) មួយចំនួន ឬសូម្បីតែទាំងអស់អាចនឹងបាត់នៅក្នុងប្រព័ន្ធជាក់លាក់មួយ។ វាត្រូវបានប៉ះពាល់ដោយការកំណត់ BIOS (ពហុស្នូល និងពហុខ្សែត្រូវបានបិទដោយឯករាជ្យ) លក្ខណៈពិសេសមីក្រូស្ថាបត្យកម្ម (ឧទាហរណ៍ HT អវត្តមានពី Intel® Core™ Duo ប៉ុន្តែត្រូវបាននាំយកមកវិញជាមួយនឹងការចេញផ្សាយ Nehalem) និងព្រឹត្តិការណ៍ប្រព័ន្ធ (ពហុ ម៉ាស៊ីនមេដំណើរការអាចបិទដំណើរការដែលបរាជ័យ ប្រសិនបើរកឃើញកំហុស ហើយបន្ត "ហោះហើរ" នៅលើឧបករណ៍ដែលនៅសល់)។ តើសួនសត្វពហុកម្រិតនេះអាចមើលឃើញដោយរបៀបណាចំពោះប្រព័ន្ធប្រតិបត្តិការ និងនៅទីបំផុតចំពោះកម្មវិធីកម្មវិធី?

លើសពីនេះ ដើម្បីភាពងាយស្រួល យើងកំណត់ចំនួន processors, cores និង threads នៅក្នុងប្រព័ន្ធជាក់លាក់មួយដោយបី ( x, y, z) កន្លែងណា xគឺជាចំនួន processors y- ចំនួនស្នូលនៅក្នុងខួរក្បាលនីមួយៗ និង z- ចំនួននៃ Hyperthreads នៅក្នុងស្នូលនីមួយៗ។ ចាប់ពីពេលនេះតទៅ ខ្ញុំនឹងហៅអ្នកទាំងបីនេះ។ ទ្រឹស្តីបទ- ពាក្យដែលបានបង្កើតឡើងដែលទាក់ទងតិចតួចជាមួយសាខានៃគណិតវិទ្យា។ ការងារ ទំ = ឆ្នាំកំណត់ចំនួនអង្គភាពដែលហៅថា ដំណើរការឡូជីខលប្រព័ន្ធ។ វាកំណត់ចំនួនសរុបនៃបរិបទឯករាជ្យនៃដំណើរការកម្មវិធីនៅលើប្រព័ន្ធសតិរួម ប្រតិបត្តិស្របគ្នាដែលប្រព័ន្ធប្រតិបត្តិការត្រូវបានបង្ខំឱ្យយកទៅក្នុងគណនី។ ខ្ញុំនិយាយថា "បង្ខំ" ព្រោះវាមិនអាចគ្រប់គ្រងលំដាប់ប្រតិបត្តិនៃដំណើរការពីរនៅលើប្រព័ន្ធដំណើរការឡូជីខលផ្សេងគ្នា។ នេះក៏អនុវត្តចំពោះ hyperthreads ផងដែរ៖ ទោះបីជាពួកវាដំណើរការ "បន្តបន្ទាប់គ្នា" នៅលើស្នូលតែមួយក៏ដោយ លំដាប់ជាក់លាក់ត្រូវបានកំណត់ដោយផ្នែករឹង ហើយមិនអាចត្រូវបានគេសង្កេតឃើញ ឬគ្រប់គ្រងដោយកម្មវិធីឡើយ។

ជាញឹកញយ ប្រព័ន្ធប្រតិបត្តិការលាក់ពីកម្មវិធីបញ្ចប់នូវលក្ខណៈនៃធាតុរូបវិទ្យានៃប្រព័ន្ធដែលវាកំពុងដំណើរការ។ ឧទាហរណ៍ តក្កវិជ្ជាទាំងបីខាងក្រោម៖ (2, 1, 1), (1, 2, 1) និង (1, 1, 2) - ប្រព័ន្ធប្រតិបត្តិការនឹងតំណាងឱ្យប្រព័ន្ធដំណើរការឡូជីខលចំនួនពីរ ទោះបីជាទីមួយនៃពួកវាមានដំណើរការពីរក៏ដោយ ទីពីរ - ស្នូលពីរនិងទីបី - គ្រាន់តែខ្សែស្រឡាយពីរ។


កម្មវិធីគ្រប់គ្រងភារកិច្ចវីនដូបង្ហាញ 8 ដំណើរការឡូជីខល; ប៉ុន្តែតើវានៅក្នុង processors, cores និង hyperthreads មានតម្លៃប៉ុន្មាន?


លីនុចកំពូលបង្ហាញប្រព័ន្ធដំណើរការឡូជីខលចំនួន 4 ។

នេះពិតជាងាយស្រួលសម្រាប់អ្នកបង្កើតកម្មវិធី - ពួកគេមិនចាំបាច់ដោះស្រាយជាមួយលក្ខណៈពិសេសផ្នែករឹងដែលជារឿយៗមិនសំខាន់សម្រាប់ពួកគេ។

និយមន័យកម្មវិធីនៃ topology

ជាការពិតណាស់ ការបំប្លែង topology ទៅក្នុងចំនួនតែមួយនៃ logical processors ក្នុងករណីខ្លះបង្កើតមូលដ្ឋានគ្រប់គ្រាន់សម្រាប់ការភ័ន្តច្រឡំ និងការយល់ច្រឡំ (នៅក្នុងជម្លោះអ៊ីនធឺណេតក្តៅ)។ កម្មវិធីកុំព្យូទ័រដែលចង់ច្របាច់ដំណើរការអតិបរមាចេញពីផ្នែករឹង ទាមទារការត្រួតពិនិត្យលម្អិតអំពីកន្លែងដែលខ្សែស្រឡាយរបស់ពួកគេនឹងត្រូវបានដាក់៖ កាន់តែខិតជិតគ្នាទៅវិញទៅមកនៅលើ hyperthreads ដែលនៅជាប់គ្នា ឬផ្ទុយទៅវិញនៅឆ្ងាយនៅលើ processors ផ្សេងៗ។ ល្បឿននៃការទំនាក់ទំនងរវាងប្រព័ន្ធដំណើរការឡូជីខលនៅក្នុងស្នូលដូចគ្នា ឬខួរក្បាលគឺខ្ពស់ជាងល្បឿននៃការផ្ទេរទិន្នន័យរវាង processors ។ លទ្ធភាពនៃភាពមិនដូចគ្នានៅក្នុងអង្គការ អង្គចងចាំចូលប្រើដោយចៃដន្យធ្វើឱ្យរូបភាពស្មុគស្មាញផងដែរ។

ព័ត៌មានអំពី topology នៃប្រព័ន្ធទាំងមូល ក៏ដូចជាទីតាំងនៃ logical processor នីមួយៗនៅក្នុង IA-32 អាចរកបានដោយប្រើការណែនាំ CPUID ។ ចាប់តាំងពីការមកដល់នៃប្រព័ន្ធពហុដំណើរការដំបូង គ្រោងការណ៍កំណត់អត្តសញ្ញាណប្រព័ន្ធដំណើរការឡូជីខលត្រូវបានពង្រីកជាច្រើនដង។ រហូតមកដល់បច្ចុប្បន្ន ផ្នែករបស់វាមាននៅក្នុងសន្លឹកទី 1, 4 និង 11 នៃ CPUID ។ តើសន្លឹកមួយណាដែលត្រូវមើលអាចកំណត់ពីតារាងលំហូរខាងក្រោមយកចេញពីអត្ថបទ៖

ខ្ញុំនឹងមិនធុញទ្រាន់នឹងអ្នកនៅទីនេះជាមួយនឹងព័ត៌មានលម្អិតទាំងអស់នៃផ្នែកនីមួយៗនៃក្បួនដោះស្រាយនេះទេ។ ប្រសិនបើមានចំណាប់អារម្មណ៍ផ្នែកបន្ទាប់នៃអត្ថបទនេះអាចត្រូវបានឧទ្ទិសដល់រឿងនេះ។ ខ្ញុំនឹងបញ្ជូនអ្នកអានដែលចាប់អារម្មណ៍ទៅ ដែលពិនិត្យមើលបញ្ហានេះឱ្យបានលម្អិតតាមដែលអាចធ្វើទៅបាន។ នេះជាដំបូង ខ្ញុំនឹងរៀបរាប់ដោយសង្ខេបអំពីអ្វីដែល APIC ជាអ្វី និងរបៀបដែលវាទាក់ទងនឹង topology ។ បន្ទាប់មកយើងនឹងពិនិត្យមើលការធ្វើការជាមួយសន្លឹក 0xB (ដប់មួយក្នុងទសភាគ) ដែលបច្ចុប្បន្ន ពាក្យចុងក្រោយនៅក្នុង "apico-construction" ។

លេខសម្គាល់ APIC
APIC មូលដ្ឋាន (ឧបករណ៍បញ្ជាការរំខានដែលអាចដំណើរការបានកម្រិតខ្ពស់) គឺជាឧបករណ៍មួយ (ឥឡូវជាផ្នែកនៃខួរក្បាល) ដែលទទួលខុសត្រូវក្នុងការដោះស្រាយការរំខានដែលចូលមកក្នុងប្រព័ន្ធដំណើរការឡូជីខលជាក់លាក់។ ដំណើរការឡូជីខលនីមួយៗមាន APIC ផ្ទាល់ខ្លួន។ ហើយពួកវានីមួយៗនៅក្នុងប្រព័ន្ធត្រូវតែមានតម្លៃ APIC ID តែមួយគត់។ លេខនេះត្រូវបានប្រើដោយឧបករណ៍បញ្ជារំខានសម្រាប់អាសយដ្ឋាននៅពេលបញ្ជូនសារ និងដោយអ្នកផ្សេងទៀត (ឧទាហរណ៍ ប្រព័ន្ធប្រតិបត្តិការ) ដើម្បីកំណត់អត្តសញ្ញាណប្រព័ន្ធដំណើរការឡូជីខល។ ការបញ្ជាក់សម្រាប់ឧបករណ៍បញ្ជារំខាននេះបានវិវត្តពី Intel 8259 PIC តាមរយៈ Dual PIC, APIC និង xAPIC ទៅ x2APIC ។

បច្ចុប្បន្ននេះ ទទឹងនៃលេខដែលរក្សាទុកក្នុងលេខសម្គាល់ APIC បានឈានដល់ 32 ប៊ីត បើទោះបីជាកាលពីមុនវាត្រូវបានកំណត់ត្រឹម 16 ប៊ីត ហើយសូម្បីតែមុននេះ - មានតែ 8 ប៊ីតប៉ុណ្ណោះ។ សព្វថ្ងៃនេះ សំណល់នៃថ្ងៃចាស់ត្រូវបានរាយប៉ាយពាសពេញ CPUID ប៉ុន្តែ CPUID.0xB.EDX ត្រឡប់លេខ 32 ប៊ីត APIC ទាំងអស់។ នៅលើប្រព័ន្ធដំណើរការឡូជីខលនីមួយៗដែលប្រតិបត្តិការណែនាំ CPUID ដោយឯករាជ្យ តម្លៃផ្សេងគ្នានឹងត្រូវបានត្រឡប់។

ការបញ្ជាក់អំពីទំនាក់ទំនងគ្រួសារ
តម្លៃ APIC ID ខ្លួនវាមិនប្រាប់អ្នកអ្វីទាំងអស់អំពី topology ។ ដើម្បីស្វែងយល់ថាតើប្រព័ន្ធដំណើរការឡូជីខលពីរណាដែលមានទីតាំងនៅខាងក្នុង processor រាងកាយមួយ (ពោលគឺពួកវាជា "បងប្អូន" hyperthreads) ដែលពីរនៅក្នុង processor ដូចគ្នា ហើយមួយណាជា processors ខុសគ្នាទាំងស្រុង អ្នកត្រូវប្រៀបធៀបតម្លៃ APIC ID របស់ពួកគេ។ អាស្រ័យលើកម្រិតនៃទំនាក់ទំនង ប៊ីតមួយចំនួនរបស់ពួកគេនឹងស្របគ្នា។ ព័ត៌មាននេះមាននៅក្នុងបញ្ជីរង CPUID.0xB ដែលត្រូវបានប្រតិបត្តិ និងអ៊ិនកូដនៅក្នុង ECX ។ ពួកវានីមួយៗពិពណ៌នាអំពីទីតាំងនៃវាលប៊ីតនៃកម្រិតតូប៉ូឡូញមួយនៅក្នុង EAX (ច្បាស់ជាងនេះទៅទៀត ចំនួនប៊ីតដែលត្រូវប្តូរទៅខាងស្តាំក្នុងលេខសម្គាល់ APIC ដើម្បីលុបចេញ។ កម្រិតទាប topology) ក៏ដូចជាប្រភេទនៃស្រទាប់នេះ - hyperthread, core ឬ processor - នៅក្នុង ECX ។

ដំណើរការឡូជីខលដែលមានទីតាំងនៅខាងក្នុងស្នូលដូចគ្នានឹងមានប៊ីត APIC ID ដូចគ្នាទាំងអស់ លើកលែងតែអ្វីដែលជាកម្មសិទ្ធិរបស់វាល SMT ។ សម្រាប់ប្រព័ន្ធដំណើរការឡូជីខលដែលមានទីតាំងនៅក្នុងខួរក្បាលដូចគ្នា ប៊ីតទាំងអស់ លើកលែងតែវាលស្នូល និង SMT ។ ដោយសារចំនួននៃសន្លឹករងសម្រាប់ CPUID.0xB អាចកើនឡើង គ្រោងការណ៍នេះនឹងអនុញ្ញាតឱ្យយើងគាំទ្រការពិពណ៌នានៃ topologies ជាមួយនឹងកម្រិតកាន់តែច្រើន ប្រសិនបើតម្រូវការកើតឡើងនាពេលអនាគត។ លើសពីនេះទៅទៀត វានឹងអាចណែនាំកម្រិតមធ្យមរវាងអ្នកដែលមានស្រាប់។

ផលវិបាកដ៏សំខាន់នៃការរៀបចំគ្រោងការណ៍នេះគឺថានៅក្នុងសំណុំនៃ APIC ID ទាំងអស់នៃដំណើរការឡូជីខលទាំងអស់នៃប្រព័ន្ធអាចមាន "រន្ធ" ពោលគឺឧ។ ពួកគេនឹងមិនបន្តបន្ទាប់គ្នាទេ។ ជាឧទាហរណ៍ នៅក្នុងប្រព័ន្ធដំណើរការពហុស្នូលដែលមាន HT បានបិទ លេខសម្គាល់ APIC ទាំងអស់អាចប្រែទៅជាស្មើគ្នា ចាប់តាំងពីប៊ីតដ៏សំខាន់បំផុតដែលទទួលខុសត្រូវចំពោះការអ៊ិនកូដលេខខ្សែធំនឹងតែងតែជាសូន្យ។

ខ្ញុំកត់សម្គាល់ថា CPUID.0xB មិនមែនជាប្រភពតែមួយនៃព័ត៌មានអំពីប្រព័ន្ធដំណើរការឡូជីខលដែលមាននៅក្នុងប្រព័ន្ធប្រតិបត្តិការនោះទេ។ បញ្ជីនៃដំណើរការទាំងអស់ដែលមានសម្រាប់វា រួមជាមួយនឹងតម្លៃ APIC ID របស់ពួកគេត្រូវបានអ៊ិនកូដនៅក្នុងតារាង MADT ACPI ។

ប្រព័ន្ធប្រតិបត្តិការ និង topology

ប្រព័ន្ធប្រតិបត្តិការផ្តល់ព័ត៌មានអំពី topology នៃ logical processors ដល់កម្មវិធីដោយប្រើ interfaces ផ្ទាល់របស់ពួកគេ។

នៅលើ Linux ព័ត៌មាន topology មាននៅក្នុង /proc/cpuinfo pseudofile ក៏ដូចជាលទ្ធផលនៃពាក្យបញ្ជា dmidecode ។ ក្នុងឧទាហរណ៍ខាងក្រោម ខ្ញុំត្រងខ្លឹមសារនៃ cpuinfo នៅលើប្រព័ន្ធ quad-core មួយចំនួនដោយគ្មាន HT ដោយបន្សល់ទុកតែធាតុដែលទាក់ទងនឹង topology៖

អត្ថបទដែលលាក់

ggg@shadowbox:~$ cat /proc/cpuinfo |grep "processor\|physical\id\|siblings\|core\|cores\|apicid" processor: 0 លេខសម្គាល់រាងកាយ: 0 បងប្អូនបង្កើត: 4 core id: 0 cpu cores: 2 apicid: 0 apicid ដំបូង: 0 processor: 1 លេខសម្គាល់រាងកាយ: 0 បងប្អូន: 4 core id: 0 cpu cores: 2 apicid: 1 initial apicid: 1 processor: 2 លេខសម្គាល់រាងកាយ: 0 បងប្អូន: 4 core id: 1 cpu cores: 2 apicid: 2 apicid ដំបូង: 2 processor: 3 លេខសម្គាល់រាងកាយ: 0 បងប្អូន: 4 core id: 1 cpu cores: 2 apicid: 3 initial apicid: 3

នៅលើ FreeBSD topology ត្រូវបានរាយការណ៍តាមរយៈយន្តការ sysctl នៅក្នុងអថេរ kern.sched.topology_spec ជា XML៖

អត្ថបទដែលលាក់

user@host:~$ sysctl kern.sched.topology_spec kern.sched.topology_spec៖ 0, 1, 2, 3, 4, 5, 6, 7 0, 1, 2, 3, 4, 5, 6, 7 0, 1 ក្រុម THREADក្រុម SMT 2, 3 ក្រុម THREADក្រុម SMT 4, 5 ក្រុម THREADក្រុម SMT 6, 7 ក្រុម THREADក្រុម SMT

នៅក្នុង MS Windows 8 ព័ត៌មាន topology អាចត្រូវបានគេមើលឃើញនៅក្នុង Task Manager ។

ពីចំនួនស្នូលនៅក្នុង ដំណើរការកណ្តាលដំណើរការប្រព័ន្ធទាំងមូលត្រូវបានប៉ះពាល់យ៉ាងខ្លាំង ជាពិសេសនៅក្នុងរបៀបកិច្ចការច្រើន។ អ្នកអាចស្វែងរកលេខរបស់ពួកគេដោយប្រើកម្មវិធីភាគីទីបី ឬវិធីសាស្ត្រវីនដូស្តង់ដារ។

ខួរក្បាលភាគច្រើនឥឡូវនេះមានស្នូល 2-4 ប៉ុន្តែមានម៉ូដែលថ្លៃៗសម្រាប់កុំព្យូទ័រលេងហ្គេម និងមជ្ឈមណ្ឌលទិន្នន័យដែលមាន 6 និងសូម្បីតែ 8 cores ។ កាលពីមុន នៅពេលដែលខួរក្បាលកណ្តាលមានស្នូលតែមួយ ដំណើរការទាំងអស់ស្ថិតនៅក្នុងប្រេកង់ ហើយការធ្វើការជាមួយកម្មវិធីជាច្រើនក្នុងពេលតែមួយអាចព្យួរ OS ទាំងស្រុង។

អ្នកអាចកំណត់ចំនួនស្នូល ក៏ដូចជាមើលគុណភាពនៃការងាររបស់ពួកគេ ដោយប្រើដំណោះស្រាយដែលបានបង្កើតនៅក្នុង Windows ខ្លួនឯង ឬកម្មវិធីភាគីទីបី (អត្ថបទនឹងពិភាក្សាអំពីភាពពេញនិយមបំផុតរបស់ពួកគេ)។

វិធីសាស្រ្តទី 1: AIDA64

គឺជាកម្មវិធីដ៏ពេញនិយមសម្រាប់ត្រួតពិនិត្យដំណើរការកុំព្យូទ័រ និងធ្វើតេស្តផ្សេងៗ។ កម្មវិធីត្រូវបានបង់ ប៉ុន្តែមានកំឡុងពេលសាកល្បងដែលវាគ្រប់គ្រាន់ដើម្បីស្វែងរកចំនួនស្នូលនៅក្នុង CPU ។ ចំណុចប្រទាក់ AIDA64 ត្រូវបានបកប្រែទាំងស្រុងទៅជាភាសារុស្សី។

ការណែនាំមើលទៅដូចនេះ៖


វិធីសាស្រ្តទី 2: CPU-Z

CPU-Z គឺជាកម្មវិធីឥតគិតថ្លៃដែលអនុញ្ញាតឱ្យអ្នកទទួលបានព័ត៌មានមូលដ្ឋានទាំងអស់អំពីសមាសធាតុកុំព្យូទ័ររបស់អ្នក។ វាមានចំណុចប្រទាក់សាមញ្ញដែលត្រូវបានបកប្រែជាភាសារុស្សី។

ដើម្បីស្វែងយល់ពីចំនួនស្នូលដោយប្រើកម្មវិធីនេះ អ្នកគ្រាន់តែត្រូវដំណើរការវា។ នៅក្នុងបង្អួចមេ ស្វែងរកនៅផ្នែកខាងក្រោមបំផុត នៅផ្នែកខាងស្តាំ ធាតុ "ស្នូល". ទល់មុខវានឹងត្រូវបានសរសេរចំនួនស្នូល។

វិធីសាស្រ្តទី 3: កម្មវិធីគ្រប់គ្រងភារកិច្ច

វិធីសាស្រ្តនេះគឺសមរម្យសម្រាប់តែអ្នកប្រើប្រាស់ Windows 8, 8.1 និង 10 ប៉ុណ្ណោះ។ សូមអនុវត្តតាមជំហានទាំងនេះ ដើម្បីស្វែងរកចំនួនស្នូលតាមវិធីនេះ៖


វិធីទី ៤៖ កម្មវិធីគ្រប់គ្រងឧបករណ៍

វិធីសាស្រ្តនេះគឺសមរម្យសម្រាប់កំណែទាំងអស់របស់ Windows ។ នៅពេលប្រើវា អ្នកគួរតែចងចាំថា សម្រាប់ដំណើរការ Intel មួយចំនួន ព័ត៌មានអាចត្រូវបានបង្ហាញមិនត្រឹមត្រូវ។ ការពិតគឺថា ស៊ីភីយូ Intel ប្រើបច្ចេកវិទ្យា Hyper-threading ដែលបែងចែកស្នូលដំណើរការមួយទៅជាខ្សែស្រឡាយជាច្រើន ដោយហេតុនេះបង្កើនដំណើរការ។ ប៉ុន្តែក្នុងពេលតែមួយ "អ្នក​គ្រប់​គ្រង​ឧបករណ៍"អាចមើលឃើញខ្សែស្រឡាយផ្សេងគ្នានៅលើស្នូលដូចគ្នាជាមួយនឹងស្នូលដាច់ដោយឡែកជាច្រើន។

ការណែនាំជាជំហាន ៗ មើលទៅដូចនេះ៖


វាមិនពិបាកក្នុងការស្វែងរកដោយឯករាជ្យនូវចំនួនស្នូលនៅក្នុងខួរក្បាលកណ្តាលនោះទេ។ អ្នកក៏អាចមើលលក្ខណៈជាក់លាក់នៅក្នុងឯកសារសម្រាប់កុំព្យូទ័រ/កុំព្យូទ័រយួរដៃរបស់អ្នក ប្រសិនបើអ្នកមានវានៅនឹងដៃ។ ឬ Google ម៉ូដែល processor ប្រសិនបើអ្នកស្គាល់វា។

នៅដើមឆ្នាំនៃសហសវត្សរ៍ថ្មី នៅពេលដែលប្រេកង់ស៊ីភីយូនៅទីបំផុតបានឆ្លងកាត់សញ្ញា 1 GHz ក្រុមហ៊ុនមួយចំនួន (កុំចង្អុលដៃទៅ Intel) បានព្យាករណ៍ថា ស្ថាបត្យកម្មថ្មី។ NetBurst នឹងអាចឈានដល់ប្រេកង់ប្រហែល 10 GHz នាពេលអនាគត។ អ្នកចូលចិត្តរំពឹងថានឹងមកដល់នៃយុគសម័យថ្មីនៅពេលដែលល្បឿននាឡិកា CPU នឹងកើនឡើងដូចផ្សិតបន្ទាប់ពីភ្លៀង។ ត្រូវការការសម្តែងបន្ថែមទៀត? គ្រាន់​តែ​ដំឡើង​កំណែ​ទៅ​ប្រព័ន្ធ​ដំណើរការ​ដែល​មាន​នាឡិកា​លឿន​ជាង។

ផ្លែប៉ោមរបស់ញូវតុនបានធ្លាក់ចុះយ៉ាងខ្លាំងនៅលើក្បាលរបស់អ្នកសុបិនដែលចាត់ទុកមេហ្គាហឺតច្រើនបំផុត វិធី​ងាយស្រួលការកើនឡើងជាបន្តបន្ទាប់នៃដំណើរការកុំព្យូទ័រ។ ដែនកំណត់រាងកាយមិនអនុញ្ញាតឱ្យមានការកើនឡើងនៃប្រេកង់នាឡិកាដោយគ្មានការកើនឡើងដែលត្រូវគ្នានៃការបង្កើតកំដៅទេ ហើយបញ្ហាផ្សេងទៀតដែលទាក់ទងនឹងបច្ចេកវិទ្យាផលិតកម្មក៏ចាប់ផ្តើមកើតឡើងផងដែរ។ ពិតជា ឆ្នាំមុនដំណើរការលឿនបំផុតដំណើរការនៅប្រេកង់ចន្លោះពី 3 ទៅ 4 GHz ។

ជាការពិតណាស់ វឌ្ឍនភាពមិនអាចបញ្ឈប់បានទេ នៅពេលដែលមនុស្សសុខចិត្តចំណាយប្រាក់សម្រាប់វា - មានអ្នកប្រើប្រាស់ជាច្រើនដែលមានឆន្ទៈក្នុងការចំណាយច្រើនសន្ធឹកសន្ធាប់សម្រាប់កុំព្យូទ័រដែលមានថាមពលខ្លាំងជាងនេះ។ ដូច្នេះហើយ វិស្វករបានចាប់ផ្តើមស្វែងរកវិធីផ្សេងទៀតដើម្បីបង្កើនការអនុវត្ត ជាពិសេសដោយការបង្កើនប្រសិទ្ធភាពនៃការប្រតិបត្តិពាក្យបញ្ជា ហើយមិនត្រឹមតែពឹងផ្អែកលើល្បឿននាឡិកាប៉ុណ្ណោះទេ។ Parallelism ក៏ក្លាយជាដំណោះស្រាយមួយដែរ - ប្រសិនបើអ្នកមិនអាចធ្វើឱ្យស៊ីភីយូលឿនជាងនេះទេ ហេតុអ្វីបានជាមិនបន្ថែម processor ទីពីរនៃប្រភេទដូចគ្នាដើម្បីបង្កើនធនធានកុំព្យូទ័រ?

Pentium EE 840 គឺជាស៊ីភីយូ dual-core ដំបូងគេដែលបង្ហាញខ្លួននៅក្នុងការលក់រាយ។

បញ្ហាចម្បងជាមួយការស្របគ្នាគឺថាកម្មវិធីត្រូវតែត្រូវបានសរសេរជាពិសេសដើម្បីចែកចាយបន្ទុកឆ្លងកាត់ខ្សែស្រលាយច្រើន - មានន័យថាអ្នកនឹងមិនទទួលបាន bang ភ្លាមៗសម្រាប់ប្រាក់កាក់របស់អ្នក មិនដូចប្រេកង់ទេ។ នៅឆ្នាំ 2005 នៅពេលដែលប្រព័ន្ធដំណើរការ dual-core ដំបូងចេញមក ពួកគេមិនបានផ្តល់ការបង្កើនប្រសិទ្ធភាពគួរឱ្យកត់សម្គាល់នោះទេ ដោយសារមួយចំនួនតូចត្រូវបានប្រើប្រាស់នៅលើកុំព្យូទ័រលើតុ។ កម្មវិធីដែលនឹងគាំទ្រពួកគេ។ តាមពិតទៅ ភាគច្រើនស៊ីភីយូ dual-core មានល្បឿនយឺតជាង single-core processors ក្នុងកិច្ចការភាគច្រើន ដោយសារ CPU single-core ដំណើរការក្នុងល្បឿននាឡិកាខ្ពស់។

ទោះជាយ៉ាងណាក៏ដោយ បួនឆ្នាំបានកន្លងផុតទៅហើយ ហើយមានការផ្លាស់ប្តូរជាច្រើនក្នុងអំឡុងពេលពួកគេ។ អ្នកបង្កើតកម្មវិធីជាច្រើនបានបង្កើនប្រសិទ្ធភាពផលិតផលរបស់ពួកគេដើម្បីទាញយកអត្ថប្រយោជន៍ពីស្នូលជាច្រើន។ ខួរក្បាល Single-core ឥឡូវនេះពិបាករកនៅលើការលក់ ហើយស៊ីភីយូ dual-, triple- និង quad-core ត្រូវបានចាត់ទុកថាជារឿងធម្មតា។

ប៉ុន្តែសំណួរកើតឡើង: តើអ្នកត្រូវការស្នូលស៊ីភីយូប៉ុន្មាន? តើប្រព័ន្ធដំណើរការបីស្នូលគ្រប់គ្រាន់សម្រាប់ការលេងហ្គេម ឬតើវាប្រសើរជាងក្នុងការបង់ប្រាក់បន្ថែម និងទទួលបានបន្ទះឈីប quad-core ដែរឬទេ? តើប្រព័ន្ធដំណើរការ dual-core គ្រប់គ្រាន់សម្រាប់អ្នកប្រើប្រាស់ជាមធ្យម ឬតើស្នូលជាច្រើនទៀតពិតជាធ្វើឱ្យមានភាពខុសគ្នាមែនទេ? តើកម្មវិធីមួយណាត្រូវបានធ្វើឱ្យប្រសើរសម្រាប់ស្នូលច្រើន ហើយតើកម្មវិធីណានឹងឆ្លើយតបតែចំពោះការផ្លាស់ប្តូរលក្ខណៈជាក់លាក់ដូចជាប្រេកង់ ឬទំហំឃ្លាំងសម្ងាត់?

យើងគិតថាវាជាពេលវេលាដ៏ល្អមួយដើម្បីសាកល្បងកម្មវិធីនៅក្នុងឈុតដែលបានអាប់ដេត (ទោះបីជាការអាប់ដេតមិនទាន់បញ្ចប់ក៏ដោយ) លើការកំណត់ single-, dual-, triple-, និង quad-core ដើម្បីមើលថាតើប្រព័ន្ធដំណើរការពហុស្នូលមានតម្លៃប៉ុនណា។ ក្លាយជានៅឆ្នាំ ២០០៩ ។

ដើម្បីធានាបាននូវការធ្វើតេស្តដោយយុត្តិធម៌ យើងបានជ្រើសរើសប្រព័ន្ធដំណើរការ quad-core - Intel Core 2 Quad Q6600 overclocked ទៅ 2.7 GHz ។ បន្ទាប់​ពី​ដំណើរការ​ការ​ធ្វើ​តេស្ត​លើ​ប្រព័ន្ធ​របស់​យើង​រួច យើង​បាន​បិទ​ស្នូល​មួយ ចាប់ផ្ដើម​ឡើង​វិញ និង​ធ្វើ​តេស្ត​ម្ដង​ទៀត។ យើងបិទស្នូលជាបន្តបន្ទាប់ ហើយទទួលបានលទ្ធផលសម្រាប់ចំនួនស្នូលសកម្មផ្សេងៗគ្នា (ពីមួយទៅបួន) ខណៈពេលដែលខួរក្បាល និងប្រេកង់របស់វាមិនផ្លាស់ប្តូរ។

ការបិទដំណើរការស្នូលស៊ីភីយូនៅក្រោមវីនដូគឺងាយស្រួលធ្វើណាស់។ ប្រសិនបើអ្នកចង់ដឹងពីរបៀបធ្វើវា វាយពាក្យ "msconfig" នៅក្នុងបង្អួច "Start Search" របស់ Windows Vista ហើយចុច "Enter" ។ វានឹងបើកឧបករណ៍ប្រើប្រាស់ការកំណត់រចនាសម្ព័ន្ធប្រព័ន្ធ។

នៅក្នុងវាចូលទៅកាន់ផ្ទាំង "ចាប់ផ្ដើម" ហើយចុចប៊ូតុង "ជម្រើសកម្រិតខ្ពស់" ។

វានឹងធ្វើឱ្យបង្អួចជម្រើសកម្រិតខ្ពស់ BOOT បង្ហាញឡើង។ ជ្រើសរើសប្រអប់ធីក "ចំនួននៃដំណើរការ" ហើយបញ្ជាក់ចំនួនស្នូលដំណើរការដែលត្រូវការដែលនឹងសកម្មនៅក្នុងប្រព័ន្ធ។ អ្វីគ្រប់យ៉ាងគឺសាមញ្ញណាស់។

បន្ទាប់​ពី​ការ​បញ្ជាក់ កម្មវិធី​នឹង​ប្រាប់​អ្នក​ឱ្យ​ចាប់ផ្ដើម​ឡើង​វិញ។ បន្ទាប់ពីការចាប់ផ្តើមឡើងវិញ អ្នកអាចឃើញចំនួនស្នូលសកម្មនៅក្នុង Windows Task Manager។ "កម្មវិធីគ្រប់គ្រងភារកិច្ច" ត្រូវបានហៅដោយចុចគ្រាប់ចុច Crtl + Shift + Esc ។

ជ្រើសរើសផ្ទាំង "ការអនុវត្ត" នៅក្នុង "កម្មវិធីគ្រប់គ្រងភារកិច្ច" ។ នៅក្នុងវា អ្នកអាចមើលឃើញក្រាហ្វផ្ទុកសម្រាប់ processor/core នីមួយៗ (ថាតើវាជា processor/core ដាច់ដោយឡែក ឬជា virtual processor ដូចដែលយើងទទួលបាននៅក្នុងករណី Core i7 ជាមួយនឹងការគាំទ្រ Hyper-Threading សកម្ម) នៅក្នុងធាតុ "CPU Usage History" . ក្រាហ្វពីរមានន័យថាស្នូលសកម្មពីរ បី - ស្នូលសកម្មបី។ល។

ឥឡូវ​នេះ​អ្នក​បាន​ស៊ាំ​នឹង​វិធីសាស្ត្រ​នៃ​ការ​ធ្វើ​តេស្ត​របស់​យើង​ហើយ សូម​ឲ្យ​យើង​បន្ត​ទៅ​ការ​ពិនិត្យ​លម្អិត​អំពី​ការ​កំណត់​រចនាសម្ព័ន្ធ​កុំព្យូទ័រ​សាកល្បង និង​កម្មវិធី។

ការកំណត់រចនាសម្ព័ន្ធសាកល្បង

ផ្នែករឹងប្រព័ន្ធ
ស៊ីភីយូ Intel Core 2 Quad Q6600 (Kentsfield), 2.7 GHz, FSB-1200, ឃ្លាំងសម្ងាត់ 8 MB L2
វេទិកា MSI P7N SLI Platinum, Nvidia nForce 750i, BIOS A2
ការចងចាំ A-Data EXTREME DDR2 800+, 2 x 2048 MB, DDR2-800, CL 5-5-5-18 នៅ 1.8 V
HDD Western Digital Caviar WD50 00AAJS-00YFA, 500 GB, 7200 rpm, 8 MB cache, SATA 3.0 Gbit/s
សុទ្ធ ឧបករណ៍បញ្ជា nForce 750i Gigabit Ethernet រួមបញ្ចូលគ្នា
កាតវីដេអូ Gigabyte GV-N250ZL-1GI 1 GB DDR3 PCIe
ឯកតាថាមពល Ultra HE1000X, ATX 2.2, 1000 W
កម្មវិធី និងកម្មវិធីបញ្ជា
ប្រព័ន្ធ​ប្រតិបត្តិការ Microsoft Windows Vista Ultimate 64-bit 6.0.6001, SP1
កំណែ DirectX DirectX ១០
កម្មវិធីបញ្ជាវេទិកា nForce Driver កំណែ 15.25
កម្មវិធីបញ្ជាក្រាហ្វិក Nvidia Forceware 182.50

ការធ្វើតេស្ត និងការកំណត់

ហ្គេម 3D
គ្រីស ការ​កំណត់​គុណភាព​កំណត់​ទៅ​ទាប​បំផុត, លម្អិត​វត្ថុ​ទៅ​ខ្ពស់, រូបវិទ្យា​ទៅ​ខ្ពស់​ខ្លាំង, កំណែ 1.2.1, 1024x768, ឧបករណ៍ Benchmark, 3-រត់​មធ្យម
ឆ្វេង 4 ស្លាប់ ការកំណត់គុណភាពកំណត់ទៅទាបបំផុត 1024x768 កំណែ 1.0.1.1 ការបង្ហាញតាមពេលកំណត់។
ពិភពលោកនៅក្នុងជម្លោះ ការកំណត់គុណភាពកំណត់ទៅទាបបំផុត 1024x768, បំណះ 1.009, ស្តង់ដារភ្ជាប់មកជាមួយ។
កម្មវិធី iTunes កំណែ៖ 8.1.0.52, ស៊ីឌីអូឌីយ៉ូ ("Terminator II" SE), 53 នាទី, ទម្រង់ AAC លំនាំដើម
ឡូយ MP3 កំណែ៖ 3.98 (64-ប៊ីត), ស៊ីឌីអូឌីយ៉ូ ""Terminator II" SE, 53 នាទី, រលកទៅ MP3, 160 Kb/s
TMPEG 4.6 កំណែ៖ 4.6.3.268, ឯកសារនាំចូល៖ "Terminator II" SE DVD (5 នាទី), គុណភាពបង្ហាញ: 720x576 (PAL) 16:9
DivX 6.8.5 របៀប​អ៊ិនកូដ៖ គុណភាព​មិន​ល្អ ការ​ពង្រឹង​ពហុ​ខ្សែ​ការ​បាន​បើក​ដោយ​ប្រើ SSE4 ការ​ស្វែងរក​បួន​បួន​ភីកសែល
XviD 1.2.1 បង្ហាញស្ថានភាពការអ៊ិនកូដ = បិទ
គោលគំនិតចម្បង 1.6.1 MPEG2 ទៅ MPEG2 (H.264), MainConcept H.264/AVC Codec, 28 វិនាទី HDTV 1920x1080 (MPEG2), អូឌីយ៉ូ៖ MPEG2 (44.1 KHz, 2 Channel, 16-Bit, 224 Kb/s), របៀប៖ PAL (25 FPS), ប្រវត្តិរូប៖ ការកំណត់ផ្នែករឹងរបស់ Tom សម្រាប់ Qct-Core
Autodesk 3D Studio Max 2009 (64 ប៊ីត) កំណែ៖ ឆ្នាំ ២០០៩ បង្ហាញរូបភាពនាគនៅ 1920x1080 (HDTV)
កម្មវិធី Adobe Photoshop CS3 កំណែ៖ 10.0x20070321, ត្រងពីរូបថត TIF ទំហំ 69 MB, ស្តង់ដារ៖ Tomshardware-Benchmark V1.0.0.4, តម្រង៖ Crosshatch, Glass, Sumi-e, Accented Edges, Angled Strokes, Sprayed Strokes
Grisoft AVG Antivirus ៨ កំណែ៖ 8.0.134, មូលដ្ឋានមេរោគ៖ 270.4.5/1533, គោល៖ ស្កេន 334 MB នៃឯកសារដែលបានបង្ហាប់ ZIP/RAR
WinRAR 3.80 កំណែ 3.80, Benchmark: THG-Workload (334 MB)
WinZip ១២ កំណែ 12, ការបង្ហាប់=ល្អបំផុត, គោល: THG-Workload (334 MB)
3DMark Vantage កំណែ៖ 1.02 ពិន្ទុ GPU និង CPU
PCMark Vantage កំណែ៖ 1.00, ប្រព័ន្ធ, អង្គចងចាំ, ស្តង់ដារនៃថាសរឹង, Windows Media Player 10.00.00.3646
SiSoftware Sandra 2009 SP3 ការធ្វើតេស្តស៊ីភីយូ=ស៊ីភីយូនព្វន្ធ/ពហុមេឌា, ការធ្វើតេស្តអង្គចងចាំ=ស្តង់ដារកម្រិតបញ្ជូន

លទ្ធផល​តេ​ស្ត

ចូរចាប់ផ្តើមជាមួយនឹងលទ្ធផលនៃការធ្វើតេស្តសំយោគ ដូច្នេះយើងអាចវាយតម្លៃថាតើពួកវាត្រូវគ្នានឹងការធ្វើតេស្តពិតប្រាកដកម្រិតណា។ វាជាការសំខាន់ក្នុងការចងចាំថាការធ្វើតេស្តសំយោគត្រូវបានសរសេរជាមួយនឹងអនាគតនៅក្នុងចិត្ត ដូច្នេះពួកគេគួរតែឆ្លើយតបកាន់តែច្រើនចំពោះការផ្លាស់ប្តូរចំនួនស្នូលជាងកម្មវិធីពិត។

យើងនឹងចាប់ផ្តើមជាមួយនឹងការធ្វើតេស្តសមត្ថភាពលេងហ្គេមសំយោគ 3DMark Vantage។ យើងបានជ្រើសរើសការរត់ "Entry" ដែល 3DMark ដំណើរការនៅកម្រិតគុណភាពបង្ហាញទាបបំផុត ដើម្បីឱ្យដំណើរការស៊ីភីយូមានឥទ្ធិពលកាន់តែខ្លាំងលើលទ្ធផល។

កំណើនលីនេអ៊ែរស្ទើរតែគួរឱ្យចាប់អារម្មណ៍ណាស់។ ការកើនឡើងដ៏ធំបំផុតត្រូវបានគេសង្កេតឃើញនៅពេលផ្លាស់ទីពីស្នូលមួយទៅពីរ ប៉ុន្តែសូម្បីតែបន្ទាប់មក ការធ្វើមាត្រដ្ឋានគឺគួរឱ្យកត់សម្គាល់ណាស់។ ឥឡូវនេះសូមបន្តទៅការធ្វើតេស្ត PCMark Vantage ដែលត្រូវបានរចនាឡើងដើម្បីបង្ហាញពីដំណើរការនៃប្រព័ន្ធទាំងមូល។

លទ្ធផល PCMark បង្ហាញថាអ្នកប្រើប្រាស់ចុងក្រោយនឹងទទួលបានអត្ថប្រយោជន៍ពីការបង្កើនចំនួនស្នូលស៊ីភីយូដល់បី ហើយស្នូលទីបួន ផ្ទុយទៅវិញនឹងកាត់បន្ថយដំណើរការបន្តិច។ តោះមើលអ្វីដែលបណ្តាលឱ្យមានលទ្ធផលនេះ។

នៅក្នុងការធ្វើតេស្តប្រព័ន្ធរងនៃអង្គចងចាំ យើងឃើញការកើនឡើងនូវដំណើរការដ៏ធំបំផុតម្តងទៀតនៅពេលផ្លាស់ប្តូរពីស្នូលស៊ីភីយូមួយទៅពីរ។

ការធ្វើតេស្តផលិតភាព វាហាក់បីដូចជាយើងមានឥទ្ធិពលខ្លាំងបំផុតទៅលើលទ្ធផលទាំងមូលនៃការធ្វើតេស្ត PCMark ចាប់តាំងពីក្នុងករណីនេះការកើនឡើងនៃដំណើរការបញ្ចប់ត្រឹមបីស្នូល។ ចាំមើលថាតើលទ្ធផលនៃការធ្វើតេស្តសំយោគមួយទៀត SiSoft Sandra គឺស្រដៀងគ្នា។

យើងនឹងចាប់ផ្តើមជាមួយនឹងការធ្វើតេស្តនព្វន្ធ និងពហុព័ត៌មានរបស់ SiSoft Sandra។


ការធ្វើតេស្តសំយោគបង្ហាញពីការកើនឡើងនៃការអនុវត្តជាក់ស្តែងនៅពេលផ្លាស់ប្តូរពីស្នូលស៊ីភីយូមួយទៅបួន។ ការធ្វើតេស្តនេះត្រូវបានសរសេរជាពិសេសដើម្បីធ្វើឱ្យការប្រើប្រាស់ស្នូលចំនួនបួនប្រកបដោយប្រសិទ្ធភាព ប៉ុន្តែយើងសង្ស័យថាកម្មវិធីក្នុងពិភពពិតនឹងឃើញដំណើរការលីនេអ៊ែរដូចគ្នា។

ការធ្វើតេស្តអង្គចងចាំ Sandra ក៏ណែនាំថា ស្នូលបីនឹងផ្តល់កម្រិតបញ្ជូននៃអង្គចងចាំបន្ថែមទៀតនៅក្នុងប្រតិបត្តិការសតិបណ្ដោះអាសន្ន iSSE2 ។

បន្ទាប់ពីការធ្វើតេស្តសំយោគ វាដល់ពេលដែលត្រូវមើលថាតើយើងទទួលបានអ្វីខ្លះនៅក្នុងការធ្វើតេស្តកម្មវិធី

ការអ៊ិនកូដសំឡេងជាផ្នែកមួយដែលកម្មវិធីមិនទទួលបានអត្ថប្រយោជន៍ច្រើនពីស្នូលច្រើន ឬមិនត្រូវបានធ្វើឱ្យប្រសើរដោយអ្នកអភិវឌ្ឍន៍។ ខាងក្រោមនេះជាលទ្ធផលពី Lame និង iTunes។

Lame មិនបង្ហាញអត្ថប្រយោជន៍ច្រើនទេនៅពេលប្រើស្នូលច្រើន។ គួរឱ្យចាប់អារម្មណ៍ យើងឃើញការកើនឡើងនូវដំណើរការតូចមួយជាមួយនឹងចំនួនស្នូលនៃស្នូល ដែលពិតជាចម្លែកណាស់។ ទោះយ៉ាងណាក៏ដោយ ភាពខុសគ្នាគឺតូច ដូច្នេះវាប្រហែលជាស្ថិតនៅក្នុងរឹមនៃកំហុស។

សម្រាប់ iTunes យើងឃើញការជំរុញដំណើរការតូចមួយបន្ទាប់ពីដំណើរការស្នូលពីរ ប៉ុន្តែស្នូលជាច្រើនទៀតមិនធ្វើអ្វីទាំងអស់។

វាប្រែថាទាំង Lame ឬ iTunes មិនត្រូវបានធ្វើឱ្យប្រសើរសម្រាប់ស្នូលស៊ីភីយូច្រើនសម្រាប់ការអ៊ិនកូដសំឡេង។ ម៉្យាងវិញទៀត តាមដែលយើងដឹង កម្មវិធីបំប្លែងវីដេអូតែងតែត្រូវបានធ្វើឱ្យប្រសើរខ្ពស់សម្រាប់ស្នូលច្រើន ដោយសារធម្មជាតិស្របគ្នារបស់វា។ តោះមើលលទ្ធផលអ៊ិនកូដវីដេអូ។

យើង​នឹង​ចាប់​ផ្តើម​ការ​ធ្វើ​តេស្ត​ការ​អ៊ិនកូដ​វីដេអូ​របស់​យើង​ជាមួយ​នឹង MainConcept Reference។

សូមកត់សម្គាល់ពីផលប៉ះពាល់ដែលការបង្កើនចំនួនស្នូលមានលើលទ្ធផល៖ ពេលវេលានៃការអ៊ិនកូដធ្លាក់ចុះពីប្រាំបួននាទីនៅលើខួរក្បាល single-core 2.7GHz Core 2 មកត្រឹមតែ 2 នាទី និង 30 វិនាទីនៅពេលដែលស្នូលទាំងបួនដំណើរការ។ វាច្បាស់ណាស់ថា ប្រសិនបើអ្នកប្តូរកូដវីដេអូញឹកញាប់ នោះវាជាការប្រសើរក្នុងការយកខួរក្បាលដែលមានស្នូលបួន។

តើយើងនឹងឃើញអត្ថប្រយោជន៍ស្រដៀងគ្នានៅក្នុងការធ្វើតេស្ត TMPGEnc ដែរឬទេ?

នៅទីនេះអ្នកអាចមើលឃើញផលប៉ះពាល់លើលទ្ធផលរបស់កម្មវិធីបំប្លែងកូដ។ ខណៈពេលដែលឧបករណ៍បំប្លែង DivX ត្រូវបានធ្វើឱ្យប្រសើរខ្ពស់សម្រាប់ស្នូលស៊ីភីយូច្រើន Xvid មិនបង្ហាញពីអត្ថប្រយោជន៍គួរឱ្យកត់សម្គាល់នោះទេ។ ទោះយ៉ាងណាក៏ដោយសូម្បីតែ Xvid កាត់បន្ថយពេលវេលាអ៊ិនកូដ 25% នៅពេលផ្លាស់ប្តូរពីស្នូលមួយទៅពីរ។

តោះចាប់ផ្តើមតេស្តក្រាហ្វិកជាមួយ Adobe Photoshop ។

ដូចដែលអ្នកអាចឃើញកំណែ CS3 មិនកត់សំគាល់ការបន្ថែមខឺណែលទេ។ លទ្ធផលចម្លែកសម្រាប់កម្មវិធីដ៏ពេញនិយមបែបនេះ ទោះបីជាយើងទទួលស្គាល់ថាយើងមិនបានប្រើក៏ដោយ។ ជំនាន់​ចុងក្រោយកម្មវិធី Photoshop CS4 ។ លទ្ធផលនៃ CS3 នៅតែមិនលើកទឹកចិត្ត។

តោះមើលលទ្ធផល 3D rendering នៅក្នុង Autodesk 3ds Max។

វាច្បាស់ណាស់ថា Autodesk 3ds Max "ស្រឡាញ់" ស្នូលបន្ថែម។ លក្ខណៈពិសេសនេះ។មានវត្តមាននៅក្នុង 3ds Max សូម្បីតែនៅពេលដែលកម្មវិធីកំពុងដំណើរការនៅក្នុងបរិស្ថាន DOS ក៏ដោយ ចាប់តាំងពីកិច្ចការបង្ហាញ 3D ចំណាយពេលយូរដើម្បីបញ្ចប់ វាចាំបាច់ក្នុងការចែកចាយវានៅលើកុំព្យូទ័រជាច្រើននៅលើបណ្តាញ។ ជាថ្មីម្តងទៀតសម្រាប់កម្មវិធីបែបនេះវាជាការចង់ប្រើប្រព័ន្ធដំណើរការ quad-core ។

ការធ្វើតេស្តស្កេនកំចាត់មេរោគគឺមានភាពជិតស្និទ្ធនឹងស្ថានភាពជីវិតពិត ដោយសារស្ទើរតែគ្រប់គ្នាប្រើកម្មវិធីកំចាត់មេរោគ។

កំចាត់មេរោគ AVG បង្ហាញពីការកើនឡើងនៃដំណើរការដ៏អស្ចារ្យជាមួយនឹងការបង្កើនស្នូលស៊ីភីយូ។ ក្នុងអំឡុងពេលស្កេនកំចាត់មេរោគ ដំណើរការកុំព្យូទ័រអាចធ្លាក់ចុះយ៉ាងខ្លាំង ហើយលទ្ធផលបង្ហាញយ៉ាងច្បាស់ថា ស្នូលជាច្រើនកាត់បន្ថយពេលវេលាស្កេនយ៉ាងខ្លាំង។


WinZip និង WinRAR មិនផ្តល់នូវការកើនឡើងគួរឱ្យកត់សម្គាល់លើស្នូលច្រើនទេ។ WinRAR បង្ហាញពីការកើនឡើងនៃដំណើរការលើស្នូលពីរ ប៉ុន្តែគ្មានអ្វីទៀតទេ។ វានឹងគួរឱ្យចាប់អារម្មណ៍ក្នុងការមើលពីរបៀបដែលកំណែ 3.90 ដែលទើបនឹងចេញដំណើរការ។

នៅឆ្នាំ 2005 នៅពេលដែលកុំព្យូទ័រលើតុ dual-core ចាប់ផ្តើមលេចឡើង វាមិនមានហ្គេមណាដែលបង្ហាញពីការកើនឡើងនៃដំណើរការនោះទេ នៅពេលផ្លាស់ប្តូរពីស៊ីភីយូ single-core ទៅ multi-core processors ។ ប៉ុន្តែពេលវេលាបានផ្លាស់ប្តូរ។ តើស្នូលស៊ីភីយូច្រើនប៉ះពាល់ដល់ហ្គេមទំនើបយ៉ាងដូចម្តេច? តោះបើកដំណើរការហ្គេមពេញនិយមមួយចំនួនហើយមើល។ យើងបានដំណើរការការសាកល្បងលេងហ្គេមរបស់យើងនៅកម្រិតភាពច្បាស់ទាបនៃ 1024x768 និងជាមួយនឹងកម្រិតលម្អិតនៃក្រាហ្វិកដើម្បីកាត់បន្ថយផលប៉ះពាល់នៃកាតក្រាហ្វិក និងកំណត់ថាតើដំណើរការស៊ីភីយូប៉ុន្មានត្រូវបានប៉ះពាល់ដោយហ្គេមទាំងនេះ។

តោះចាប់ផ្តើមជាមួយ Crysis ។ យើងបានកាត់បន្ថយជម្រើសទាំងអស់ទៅអប្បបរមា លើកលែងតែព័ត៌មានលម្អិតរបស់វត្ថុដែលយើងកំណត់ទៅ "ខ្ពស់" និងរូបវិទ្យាផងដែរ ដែលយើងកំណត់ទៅ "ខ្ពស់ណាស់" ។ ជាលទ្ធផល ដំណើរការហ្គេមគួរតែពឹងផ្អែកលើស៊ីភីយូកាន់តែច្រើន។

Crysis បានបង្ហាញពីការពឹងផ្អែកដ៏គួរឱ្យចាប់អារម្មណ៍លើចំនួន CPU cores ដែលពិតជាគួរឱ្យភ្ញាក់ផ្អើលចាប់តាំងពីយើងគិតថាវាឆ្លើយតបកាន់តែច្រើនទៅនឹងដំណើរការរបស់កាតវីដេអូ។ ក្នុងករណីណាក៏ដោយ អ្នកអាចមើលឃើញថានៅក្នុងស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូស៊ីភីយូ នៃស្នូលស៊ីភីយូនឹងតូចជាង) ។ វាក៏គួរឱ្យចាប់អារម្មណ៍ផងដែរក្នុងការកត់សម្គាល់ថា Crysis អាចប្រើបានតែបីស្នូលប៉ុណ្ណោះ ចាប់តាំងពីការបន្ថែមលេខ 4 មិនមានភាពខុសគ្នាគួរឱ្យកត់សម្គាល់នោះទេ។

ប៉ុន្តែយើងដឹងថា Crysis ប្រើការគណនារូបវិទ្យាយ៉ាងធ្ងន់ធ្ងរ ដូច្នេះសូមមើលថាតើស្ថានភាពនឹងទៅជាយ៉ាងណានៅក្នុងហ្គេមដែលមានរូបវិទ្យាមិនសូវជឿនលឿន។ ឧទាហរណ៍នៅក្នុង Left 4 Dead ។

គួរឱ្យចាប់អារម្មណ៍ Left 4 Dead បង្ហាញពីលទ្ធផលស្រដៀងគ្នា ទោះបីជាចំណែករបស់សត្វតោនៃការកើនឡើងនៃការសម្តែងកើតឡើងបន្ទាប់ពីការបន្ថែមស្នូលទីពីរក៏ដោយ។ មានការកើនឡើងបន្តិចនៅពេលផ្លាស់ទីទៅបីស្នូល ប៉ុន្តែហ្គេមនេះមិនត្រូវការស្នូលទីបួនទេ។ និន្នាការគួរឱ្យចាប់អារម្មណ៍។ ចាំមើលថាតើវាមានលក្ខណៈធម្មតាប៉ុណ្ណាសម្រាប់យុទ្ធសាស្ត្រពេលវេលាពិតពិភពលោកក្នុងជម្លោះ។

លទ្ធផលគឺស្រដៀងគ្នាម្តងទៀត ប៉ុន្តែយើងឃើញ លក្ខណៈពិសេសអស្ចារ្យ- ស្នូលស៊ីភីយូបីផ្តល់នូវដំណើរការល្អជាងបួន។ ភាពខុសគ្នាគឺនៅជិតរឹមនៃកំហុស ប៉ុន្តែនេះបញ្ជាក់ម្តងទៀតថាស្នូលទីបួនមិនត្រូវបានប្រើនៅក្នុងហ្គេមទេ។

វាដល់ពេលហើយដើម្បីធ្វើការសន្និដ្ឋាន។ ដោយសារយើងបានទទួលទិន្នន័យច្រើន សូមសម្រួលស្ថានភាពដោយគណនាការកើនឡើងនៃការអនុវត្តជាមធ្យម។

ដំបូងខ្ញុំចង់និយាយថាលទ្ធផលនៃការធ្វើតេស្តសំយោគមានសុទិដ្ឋិនិយមពេកនៅពេលប្រៀបធៀបការប្រើប្រាស់ស្នូលច្រើនជាមួយកម្មវិធីពិត។ ការកើនឡើងនៃការអនុវត្តសម្រាប់ការធ្វើតេស្តសំយោគនៅពេលផ្លាស់ប្តូរពីស្នូលមួយទៅស្នូលជាច្រើនមើលទៅស្ទើរតែលីនេអ៊ែរ ដោយស្នូលថ្មីនីមួយៗបន្ថែម 50% នៃដំណើរការ។

នៅក្នុងកម្មវិធី យើងឃើញវឌ្ឍនភាពជាក់ស្តែងបន្ថែមទៀត - ប្រហែល 35% កើនឡើងពីស្នូលស៊ីភីយូទីពីរ 15% កើនឡើងពីទីបី និង 32% កើនឡើងពីទីបួន។ វាជារឿងចម្លែកដែលនៅពេលដែលយើងបន្ថែមស្នូលទីបី យើងទទួលបានអត្ថប្រយោជន៍តែពាក់កណ្តាលប៉ុណ្ណោះដែលស្នូលទីបួនផ្តល់ឱ្យ។

ទោះយ៉ាងណាក៏ដោយ នៅក្នុងកម្មវិធី វាជាការប្រសើរក្នុងការមើលកម្មវិធីបុគ្គល ជាជាងលទ្ធផលរួម។ ជាការពិត កម្មវិធីបំប្លែងសំឡេង ជាឧទាហរណ៍ មិនទទួលបានអត្ថប្រយោជន៍អ្វីទាំងអស់ពីការបង្កើនចំនួនស្នូល។ ម្យ៉ាងវិញទៀត កម្មវិធីអ៊ិនកូដវីដេអូទទួលបានអត្ថប្រយោជន៍យ៉ាងច្រើនពីស្នូលស៊ីភីយូ បើទោះបីជាវាអាស្រ័យច្រើនលើឧបករណ៍បំប្លែងកូដដែលបានប្រើក៏ដោយ។ នៅក្នុងករណីនៃកម្មវិធី 3D rendering 3ds Max យើងឃើញថាវាត្រូវបានធ្វើឱ្យប្រសើរឡើងយ៉ាងខ្លាំងសម្រាប់បរិស្ថានពហុស្នូល ហើយកម្មវិធីកែរូបភាព 2D ដូចជា Photoshop មិនឆ្លើយតបទៅនឹងចំនួនស្នូលនោះទេ។ កំចាត់មេរោគ AVG បានបង្ហាញពីការកើនឡើងគួរឱ្យកត់សម្គាល់នៃដំណើរការនៅលើស្នូលជាច្រើន ប៉ុន្តែការទទួលបាននៅលើឧបករណ៍ប្រើប្រាស់បង្ហាប់ឯកសារមិនមានទំហំធំទេ។

សម្រាប់ហ្គេម នៅពេលផ្លាស់ប្តូរពីស្នូលមួយទៅពីរ ដំណើរការកើនឡើង 60% ហើយបន្ទាប់ពីបន្ថែមស្នូលទីបីទៅក្នុងប្រព័ន្ធ យើងទទួលបានគម្លាត 25% ទៀត។ ស្នូលទីបួនមិនផ្តល់អត្ថប្រយោជន៍ណាមួយនៅក្នុងហ្គេមដែលយើងបានជ្រើសរើសទេ។ ជាការពិតណាស់ប្រសិនបើយើងយក ហ្គេមច្រើនទៀតបន្ទាប់មក ស្ថានភាពអាចផ្លាស់ប្តូរ ប៉ុន្តែក្នុងករណីណាក៏ដោយ ប្រព័ន្ធដំណើរការបីស្នូល Phenom II X3 ហាក់ដូចជាជម្រើសដ៏គួរឱ្យទាក់ទាញ និងមានតំលៃថោកសម្រាប់អ្នកលេងហ្គេម។ វាជាការសំខាន់ក្នុងការកត់សម្គាល់ថានៅពេលដែលផ្លាស់ទីទៅច្រើនទៀត ដំណោះស្រាយខ្ពស់។និងការបន្ថែមព័ត៌មានលម្អិតដែលមើលឃើញ ភាពខុសគ្នាដោយសារចំនួនស្នូលនឹងតូចជាងនៅពេលដែលកាតវីដេអូក្លាយជា កត្តាសម្រេចចិត្តប៉ះពាល់ដល់អត្រាស៊ុម។


ស្នូលបួន។

ជាមួយនឹងអ្វីគ្រប់យ៉ាងដែលបាននិយាយ និងធ្វើរួច ការសន្និដ្ឋានមួយចំនួនអាចត្រូវបានទាញ។ សរុបមក អ្នកមិនចាំបាច់ក្លាយជាអ្នកប្រើប្រាស់អាជីពណាមួយឡើយ ដើម្បីទទួលបានអត្ថប្រយោជន៍ពីការដំឡើង CPU ពហុស្នូល។ ស្ថានភាព​បាន​ប្រែប្រួល​ខ្លាំង​បើ​ធៀប​នឹង​អ្វី​ដែល​វា​មាន​កាលពី​បួន​ឆ្នាំ​មុន​។ ជាការពិតណាស់ ភាពខុសគ្នានេះហាក់បីដូចជាមិនសូវសំខាន់នៅក្រឡេកមើលដំបូងឡើយ ប៉ុន្តែវាគួរឱ្យចាប់អារម្មណ៍ណាស់ក្នុងការកត់សម្គាល់ថាតើកម្មវិធីប៉ុន្មានត្រូវបានធ្វើឱ្យប្រសើរសម្រាប់ដំណើរការ multithreading ក្នុងរយៈពេលប៉ុន្មានឆ្នាំចុងក្រោយនេះ ជាពិសេសកម្មវិធីទាំងនោះដែលអាចផ្តល់នូវប្រសិទ្ធភាពខ្ពស់ពីការបង្កើនប្រសិទ្ធភាពនេះ។ ជាការពិត យើងអាចនិយាយបានថា សព្វថ្ងៃនេះ វាគ្មានចំណុចណាមួយក្នុងការណែនាំស៊ីភីយូ single-core (ប្រសិនបើអ្នកនៅតែអាចស្វែងរកវាបាន) លើកលែងតែដំណោះស្រាយថាមពលទាប។

លើសពីនេះទៀតមានកម្មវិធីដែលអ្នកប្រើប្រាស់ត្រូវបានណែនាំឱ្យទិញ processors ជាមួយនឹងកម្រិតខ្ពស់បំផុត។ មួយចំនួនធំស្នូល។ ក្នុង​ចំណោម​កម្មវិធី​ទាំង​នោះ យើង​កត់​សម្គាល់​កម្មវិធី​អ៊ិនកូដ​វីដេអូ ការ​បង្ហាញ 3D និង​កម្មវិធី​ការងារ​ដែល​បាន​ធ្វើ​ឱ្យ​ប្រសើរ​ឡើង រួម​ទាំង​កម្មវិធី​កម្ចាត់​មេរោគ។ សម្រាប់អ្នកលេងហ្គេម ពេលវេលាកន្លងផុតទៅគឺជាថ្ងៃដែលដំណើរការ single-core ជាមួយនឹងកាតក្រាហ្វិកដ៏មានថាមពលគឺគ្រប់គ្រាន់ហើយ។

mob_info