بهینه‌سازی Node.js برای عملکرد بالا (بخش اول)

خلاصه اولیه: Node یک پلتفرم همه کاره است، اما یکی از مصارف غالب آن، ساخت پردازش‌های شبکه شده می‌باشد. در این مقاله، ما بر روی profile کردن رایج‌ترین این موارد تمرکز خواهیم کرد: وب سرورهای HTTP.

اگر برای مدت کافی در حال ساخت هر چیزی با استفاده از Node.js بوده باشید، پس بدون شک درد مشکلات مربوط به سرعت غیر منتظره را تجربه کرده‌اید. JavaScript یک زبان بر پایه رویداد، و ناهمگام است. این مسئله می‌تواند استدلالی برای پیچیدگی کارایی در آن باشد، که به زودی واضح خواهد شد. معروفیت صعودی Node.js، نیاز به ابزارها، تکنیک‌ها و تفکر مناسب برای محدودیت‌های JavaScript سمت سرور را به وجود آورده است.

وقتی که به کارایی می‌رسیم، چیزی که در مرورگر نتیجه می‌دهد، لزوما برای Node.js مناسب نیست. پس چگونه مطمئن می‌شویم که یک پیاده‌سازی Node.js سریع بوده، و برای هدف ما مناسب است؟ بیایید یک مثال را بررسی کنیم.

به بخش اول این مقاله خوش آمدید. در ادامه با ما همراه باشید...

ابزار

Node یک پلتفرم همه کاره است، اما یکی از مصارف غالب آن، ساخت پردازش‌های شبکه شده است. در این مقاله، ما بر روی profile کردن رایج‌ترین این موارد تمرکز خواهیم کرد: وب سرورهای HTTP.

ما به یک ابزار نیاز خواهیم داشت که بتواند یک سرور را با تعداد زیادی درخواست پر کند، درحالیکه کارایی آن را اندازه می‌گیرد. برای مثال، ما می‌توانیم از AutoCannon استفاده کنیم:

npm install -g autocannon

ابزار معیار سنجش خوب دیگر برای HTTP، ابزاری مانند Apache Bench (ab) و wrk2 می‌باشند، اما AutoCannon در Node نوشته شده است، فشار بارگذاری مشابهی (و گاهی بهتر) را فراهم می‌کند، و نصب آن بر روی ویندوز، لینوکس و Mac OS X بسیار ساده است.

اگر ما پس از این که یک اندازه‌گیری کارایی پایه را مستقر کرده‌ایم، تصمیم بگیریم که روند ما می‌تواند سریع‌تر باشد، به راهی برای diagnose کردن مشکلات در حین پردازش نیاز خواهیم داشت. یک ابزار عالی برای تشحیص مشکلات کارایی مختلف، Node Clinic است، که می‌تواند با استفاده از npm نصب شود:

npm install -g clinic

در واقع این دستور یک مجموعه ابزار را نصب می‌کند. ما در طی مسیر خود از Clinic Doctor و Clinic Flame استفاده خواهیم کرد.

نکته: ما برای این مثال به Node 8.11.2 یا بالاتر نیاز خواهیم داشت.

کد

مثال ما یک سرور REST ساده، با تنها یک منبع است: یک محموله JSON بزرگ که به عنوان یک مسیر GET در /seed/v1 در معرض قرار گرفته است (یا در اصطلاح expose شده است). این سرور یک پوشه به نام app می‌باشد که از یک فایل package.json (بر پایه restify 7.1.0)، یک فایل index.js و یک فایل util.js تشکیل می‌شود.

فایل index.js سرور ما چنین ظاهری دارد:

'use strict'


const restify = require('restify')

const { etagger, timestamp, fetchContent } = require('./util')()

const server = restify.createServer()



server.use(etagger().bind(server))

server.get('/seed/v1', function (req, res, next) {

  fetchContent(req.url, (err, content) => {

    if (err) return next(err)

    res.send({data: content, url: req.url, ts: timestamp()})

    next()

  })

})


server.listen(3000)

این سرور نماینده موقعیت رایج تحویل محتویات دینامیک cache شده توسط client است. این هدف با استفاده از میان‌افزار etagger تحقق می‌یابد، که هِدِر ETag را برای آخرین state محتویات، محاسبه می‌کند.

فایل util.js قطعات پیاده‌سازی‌ای را فراهم می‌کند که به طور رایج در سناریوهای این چنینی، در یک تابع برای گرفتن محتویات مرتبط از یک backend، میان‌افزار etag و یک تابع زمانی که نشانه‌های زمانی‌ای را بر یک اساس دقیقه به دقیقه فراهم می‌کند، استفاده می‌شوند:

'use strict'

require('events').defaultMaxListeners = Infinity

const crypto = require('crypto')


module.exports = () => {

  const content = crypto.rng(5000).toString('hex')

  const ONE_MINUTE = 60000

  var last = Date.now()


  function timestamp () {

    var now = Date.now()

    if (now — last >= ONE_MINUTE) last = now

    return last

  }

  function etagger () {

    var cache = {}

    var afterEventAttached = false

    function attachAfterEvent (server) {

      if (attachAfterEvent === true) return

      afterEventAttached = true

      server.on('after', (req, res) => {

        if (res.statusCode !== 200) return

        if (!res._body) return

        const key = crypto.createHash('sha512')

          .update(req.url)

          .digest()

          .toString('hex')

        const etag = crypto.createHash('sha512')

          .update(JSON.stringify(res._body))

          .digest()

          .toString('hex')

        if (cache[key] !== etag) cache[key] = etag

      })

    }

    return function (req, res, next) {

      attachAfterEvent(this)

      const key = crypto.createHash('sha512')

        .update(req.url)

        .digest()

        .toString('hex')

      if (key in cache) res.set('Etag', cache[key])

      res.set('Cache-Control', 'public, max-age=120')

      next()

    }

  }

  function fetchContent (url, cb) {

    setImmediate(() => {

      if (url !== '/seed/v1') cb(Object.assign(Error('Not Found'), {statusCode: 404}))

      else cb(null, content)

    })

  }

  return { timestamp, etagger, fetchContent }
}

این کد به هیچ وجه نمی‌تواند مثالی از یک شیوه برتر باشد! چندین نشانه از مشکلات عمیق‌تر در این کد وجود دارند، اما ما همینطور که برنامه را اندازه گرفته و profile می‌کنیم، آن‌ها را خواهیم یافت.

برای این که یک منبع کامل به عنوان نقطه شروع خود داشته باشیم، یک سرور را می‌توانید در این لینک بیابید.

Profile کردن

در جهت profile کردن، ما به دو ترمینال نیاز خواهیم داشت؛ یکی برای شروع برنامه، و دیگری برای آزمایش بارگذاری آن.

در یکی از ترمینال‌ها و در داخل پوشه app، ما می‌توانیم این کد را اجرا کنیم:

node index.js

در ترمینال دیگر، ما می‌توانیم آن را به این صورت profile کنیم:

autocannon -c100 localhost:3000/seed/v1

این کار ۱۰۰ ارتباط همزمان را باز کرده، و سرور را برای ۱۰ ثانیه پر از درخواست خواهد کرد.

نتیجه نهایی باید چنین چیزی باشد (اجرای‌ آزمایش دهم در http://localhost:3000/seed/v1 - ۱۰۰ ارتباط):

این نتیجه بر پایه دستگاه مورد استفاده شما، متفاوت خواهد بود. گرچه، با در نظر گرفتن این که یک سرور Node.js «سلام دنیا»، به سادگی قادر به انجام ۳۰.۰۰۰ درخواست بر ثانیه بر روی دستگاهی که این نتایج را تولید کرد می‌باشد، ۱۲ درخواست بر ثانیه با میانگین تاخیری که از ۳ ثانیه بیشتر می‌شود، ناراحت کننده است.

Diagnose کردن

کشف ناحیه مشکل

با تشکر از دستور Clinic Doctor، ما می‌توانیم برنامه را با تنها یک دستور diagnose کنیم. در داخل پوشه app، ما این دستور را اجرا می‌کنیم:

clinic doctor --on-port=’autocannon -c100 localhost:$PORT/seed/v1’ -- node index.js

این دستور یک فایل HTML خواهد ساخت که به طور خودکار وقتی که profile کردن به اتمام رسیده است، در مرورگر ما باز خواهد شد.

نتایج نهایی باید چیزی به مانند این مورد باشند:

Doctor به ما می‌گوید که ما احتمالا یک مشکل در حلقه رویداد (Event Loop) خود داشته‌ایم.

در کنار پیغام نزدیک به بالای رابط کاربری، ما همچنین می‌توانیم ببینیم که نمودار حلقه رویداد قرمز بوده، و یک تاخیر را نشان می‌دهد که دائما در حال افزایش است. قبل از این که عمیق‌تر به معنای آن وارد شویم، بیایید تاثیری که مشکل diagnose شده بر روی معیارهای دیگر دارد را درک کنیم.

ما می‌توانیم ببینیم همینطور که فرآیند مربوطه پیش می‌رود تا درخواست‌های صف بندی شده را پردازش کند، میزان استفاده از CPU دائما برابر با، یا بالای ۱۰۰ درصد است. موتور جاوااسکریپت Node (V8) در واقع از دو هسته CPU استفاده می‌کند، زیرا این دستگاه یک دستگاه چند هسته‌ای است و V8 از دو thread استفاده می‌نماید. یکی برای حلقه رویداد (Event Loop)، و دیگری برای Garbage Collection. وقتی که در برخی مواقع می‌بینیم میزان استفاده از CPU به ۱۲۰ درصد می‌رسد، این پردازش در حال جمع‌آوری آبجکت‌هایی مربوط به درخواست‌های رسیدگی شده می‌باشد.

ما می‌توانیم این همبستگی را در نمودار حافظه ببینیم. خط توپر در نمودار حافظه، معیار Heap Used (نمایانگر توده استفاده شده) است. هر زمان که جهشی در CPU وجود دارد، ما می‌توانیم سقوطی را در خط Heap Used ببینیم، که نشان می‌دهد میزان مصرف حافظه کم شده است.

Active Handleها تحت تاثیر تاخیر حلقه رویداد قرار نمی‌گیرند. یک Active Handle، آبجکتی است که یا I/O و یا یک تایمر را نشان می‌دهد. ما به AutoCannon دستور دادیم که ۱۰۰ ارتباط را باز کند. Active Handleها پس از شمارش ۱۰۳ توقف می‌کنند. سه handle اضافه مربوط به STDOUT، STDERR و handle مربوط به خود سرور هستند.

اگر بر روی پنل Recommendations در پایین صفحه کلیک کنیم، باید چنین چیزی را ببینیم:

تسکین کوتاه مدت

تجزیه و تحلیل علت هسته‌ای مشکلات کارایی، می‌تواند زمان‌بر باشد. در مورد یک پروژه مستقر شده و زنده، اضافه کردن حفاظت اضافه به سرورها یا سرویس‌ها، ارزشش تلاشش را دارد. هدف از حفاظت بیش از حد، این است که تاخیر حلقه رویداد را بازرسی کنیم و اگر یک threshold منتقل شد، یک پاسخ «503 Service Unavailable» را برگردانیم. این کار به یک متعادل کننده بار اجازه می‌دهد تا در مقابل نمونه‌های دیگر شکست بخورد، یا در بدترین شرایط یعنی این که کاربر باید برنامه را refresh کند. ماژول حفاظت اضافی (overload-protection module) می‌تواند این هدف را با کمترین کد اضافی برای Express، Koa و Restify فراهم کند. فریم‌وورک Hapi مقدار زیادی تنظیمات پیکربندی بارگذاری را به همراه دارد که همین نوع حفاظت را فراهم می‌کنند.

درک ناحیه مشکل

طبق توضیح کوتاه Clinic Doctor، اگر حلقه رویداد تا سطحی که ما در حال مشاهده آن هستیم تاخیر خورده باشد، احتمال این که یک یا چند تابع در حال مسدود کردن حلقه رویداد باشند، بسیار بالاست.

تشخیص این مشخصه‌های اولیه JavaScript، به خصوص برای Node.js مهم است؛ زیرا رویدادهای ناهمگام تا زمانی که کد فعلی کامل نشده است، نمی‌توانند بروز دهند.

به همین علت است که یک تابع setTimeout نمی‌تواند دقیق باشد.

برای مثال، با اجرای این کد در DevTools یک مرورگر یا Node REPL:

console.time('timeout')

setTimeout(console.timeEnd, 100, 'timeout')

let n = 1e7

while (n--) Math.random()

نتایج اندازه‌گیری‌های نهایی هیچ وقت برابر با ۱۰۰ میلی ثانیه نخواهند بود. به احتمال زیاد این نتایج در محدوده ۱۵۰ میلی ثانیه تا ۲۵۰ میلی ثانیه خواهند بود. setTimeout یک عملیات ناهمگام (console.timeEnd) را برنامه‌ریزی کرد، اما کدی که در حال حاضر موجود است، هنوز کامل نشده است و هنوز دو خط دیگر وجود دارند. کد فعلی، همچنین تحت عنوان «تیک» فعلی شناخته می‌شود. در جهت این که تیک ما کامل شود، Math.random باید ۱۰ میلیون بار فراخوانی شود. اگر این کار ۱۰۰ میلی ثانیه وقت ببرد، پس زمان کلی تا قبل از این که timeout به اتمام برسد، برابر با ۲۰۰ میلی ثانیه (به علاوه هر چقدر که طول بکشد تا تابع setTimeout زمان قبل از آن را صف‌بندی کند، که معمولا یک یا دو میلی ثانیه است) خواهد بود.

در زمینه سمت سرور، اگر خیلی طول می‌کشد تا یک عملیات در تیک فعلی کامل شود، درخواست‌ها نمی‌تواند مدیریت شوند و دریافت داده‌ها نمی‌تواند تحقق یابد؛ زیرا کد ما تا زمانی که تیک فعلی به اتمام برسد، اجرا نخواهد شد. این یعنی کدی که پر از محاسبات است، تمام تعاملات مورد انجام با سرور را کند خواهد کرد. پس پیشنهاد می‌شود که کارهای حساس به منابع را به چند پردازش تقسیم کنیم و آن‌ها را از سرور اصلی فراخوانی کنیم. این کار از موقعیت‌هایی که در آن‌ها مسیرهایی که به ندرت استفاده می‌شوند اما پربار هستند، کارایی مسیرهای دیگریی که مکررا استفاده می‌شوند اما خیلی پربار نیستند را کاهش می‌دهند، جلوگیری خواهد کرد.

سرور نمونه مقداری کد در خود دارد که حلقه رویداد را مسدود می‌کند، پس قدم بعدی این است که آن کد را بیابیم.

در بخش دوم که به زودی بر روی راکت قرار خواهد گرفت، با ما همراه باشید.

منبع