Installation and Documentation Guide for VMware SDDC Proof of Concept

POC Installation and Documentation generally available online both in VMware website and in different blogs, but these are some recommendations:

Google.com and VMware.com of course…

 

Kind Regards,
Doddi Priyambodo

Order to Start vCenter Service in Windows

Order to Start vCenter Service in Windows:

  1. VMware Directory Service
  2. VMware KDC Service
  3. VMware Certificate Service
  4. VMware Identity Management Service
  5. VMware Secure Token Service
  6. VMware VirtualCenter Server

Kind Regards,
Doddi Priyambodo

Berapa Lama untuk melakukan migrasi dari server Physical to Virtual (P2V)?

Pada saat kita memutuskan untuk melakukan konversi ke vSphere Virtual Machine, akan ada proses untuk melakukan konversi dari physical machine atau virtual machine yang sebelumnya.
Kita biasa sebut sebagai Pyhysical to Virtual (P2V) atau Virtual to Virtual (V2V).

Ketika kita ingin menggunakan P2V/V2V, maka metode konversi ini akan melalui jaringan data. Biasanya paling rendah antara source dan destination menggunakan 1Gbps koneksi.
Tetapi jika environment network ini di-share dan tidak dedicated, kemungkinan throughput yaitu antara 20GB s/d 50GB data yang bisa ditransfer dalam 1 jam (perlu dianalisa langsung pada environment customer).
Proses konversi hanya akan mengirim data yang ter-utilisasi saja, misal jika disk besarnya adalah 300 GB tetapi hanya terisi 100 GB, maka data yang dikirim hanya 100 GB saja.

Berikut ini adalah rumus transfer:
Jumlah Data yang ditransfer = Jumlah VM atau Server x Jumlah Besar Disk x Utilisasi Disk

Waktu yang dibutuhkan = Jumlah Data yang ditransfer / Estimasi Throughput

Contoh:
Jika data yang ditransfer besarnya adalah 10 TB, dan throughput adalah 50 GB/hour. Maka waktu yang dibutuhkan adalah 200 jam (8 jam). Dengan asumsi kecepatan pengiriman data stabil.

 

Kind Regards,
Doddi Priyambodo

Pertanyaan Teknis yang diajukan saat vSphere Design during Requirement Analysis

Saya coba merangkum sekilas saja mengenai beberapa pertanyaan teknis dasar yang biasa diajukan saat kita melakukan Requirement Analysis / Design Workshop engagement dengan customer.

Berikut ini adalah beberapa high level questions yang biasa saya ajukan, dan melakukan penggalian lebih dalam berdasarkan pertanyaan tersebut. (Note: ini adalah pertanyaan2 teknis, jadi bukan diajukan ke business person or C level. So, to find the correct audience is important)

  • Compute: To gather information regarding the planned target Compute infrastructure
  • Storage: To understand the current and expected storage landscape
  • vCenter: To describe the state of vCenter to manage the ESXi environment
  • Network: To gather information around current and target network infrastructure
  • Backup & Patching: To understand the current backup and patching methodology.
  • Monitor: To analyze current and expected the Monitoring processes
  • VM Workloads: To analyzie the details of the current physical workloads to be virtualized and consolidated
  • Security: To understand detail the current security practices.
  • Processes & Operations: To understand the current operation procedures and processes
  • Availlaibility & Disaster Recovery: to gather information on Business Continuity Processes

Breakdown lebih detail dari pertanyaan tersebut diatas, bisa saja dilakukan lebih detail, contohnya sebagai berikut:

  • Compute: tipe hardware, network, disk, merk, redundancy, processor, koneksi storage, booting, automation, scalability, dll
  • Storage: SAN/NAS/iSCSI/NFS/VSAN, IOps, Latency, storage technology, cloning/snapshot, replication, dll
  • vCenter: linked mode, appliance, database decision, disk size, cpu memory size, pre-requirements, dll
  • Network: leaf spine, backbone technology, bandwith, VLAN, VXLAN, teaming, VPC, link aggregation, distributed switch, vendors, dll
  • Backup and Patching: storage backup, 3rd party backup, VDP, VADP, Update Manager, dll
  • Monitor: items to monitor, centralized log server, performance, capacity, usage, tresshold, alert, placement, dll
  • VM Workloads: user growth, IOps, Tier1/Tier2/Tier3, mission critical, OS clustering, Java/Oracle/SQL Server/SAP, dll
  • Security: firewall ports, virus protection, distributed firewall, hardening system, lockdown mode, access, dll
  • Processes and Operations: SLA agreements, private/public/hybrid strategy, budget/scope constraint, unique processes, dll
  • Availability & DR: RPO, RTO, VMware HA, Fault Tolerance, Active-Active DC. Bandwith and Hops, priority protected VMs, dll

Semoga bermanfaat.

Kind Regards,
Doddi Priyambodo

Urutan dalam melakukan Backup untuk VMware vRealize Suite

Untuk sistem skala Enterprise, urutan backup adalah sesuatu yang penting untuk menjaga data consistency. Kita perlu menjamin bahwa dependency antara VM satu dengan yang lain selalu terjaga, sehingga pada saat recovery tidak ada data yang missing.

Jika anda mengimplementasikan backup secara otomatis, maka urutan backup ini dapat diatur di backup tools yang anda gunakan (ex: Symantec NetBackup)

Berikut ini adalah urutan backup yang direkomendasikan untuk dijalankan satu persatu pada saat  backup berlangsung:

  1. 1). vRealize Business
  2. 2). vRealize Log Insight
  3. 3). vRealize Operations Manager
  4. 4). vRealize Orchestrator
  5. 5). vRealize Automation (jika VRA arsitekturnya distributed, backup juga perlu berurutan)
    1. a). Proxy Agents
    2. b). DEM Workers
    3. c). DEM Orchestrator
    4. d). Manager Services (backup yang passive dulu, baru aktif)
    5. e). Websites (backup node1, node2, dst)
    6. f). vRealize Automation Appliance (backup secondary node, baru primary)
    7. g). SSO (Identity Appliance)
    8. h). PostgreSQL
    9. i). MS SQL
    10. j). Backup Load Balancers

Bagaimana? Cukup rumit bukan? Enggak ah, simple enough kok 🙂

Sekarang, setelah dibackup. Pasti akan direstore dan Power On the VM. Urutannya tinggal dibalik saja dari urutan backup keatas. Jadi tinggal dibaca dari bawah ke atas.

 

Kind Regards,
Doddi Priyambodo

Pengetesan Performance untuk Oracle Database (Oracle DB Stress Test)

Pengetesan performance untuk Oracle Database sering diperlukan untuk melakukan benchmark antara system yang ada, atau jika kita ingin mengganti ke system yang baru. Kita tidak ingin performance dengan system yang baru akan lebih buruk dengan system yang lama kan.

Berikut ini adalah beberapa cara yang biasa digunakan untuk melakukan pengetesan performance tersebut, selain dari mekanisme dibawah ini ada beberapa cara lain dengan menggunakan beberapa tools lain.

Stress test biasanya dilakukan oleh Application Team dan juga Oracle Database Administrator, dan didampingi oleh Infrastructure Administrator (Servers, Network, Storage)

Tuning dari semua sisi perlu dilakukan untuk memastikan  bahwa system yang di-test berjalan dengan baik, hal ini tidak bisa hanya dilihat dari satu sisi saja (ex: applications, middleware, database, operating system, servers, storage, network, firewalls, routers, dll).

  • Menggunakan tool SwingBench OLTP/DSS kits, Dell Quest Benchmark Factory – Ini adalah tool yang common di Oracle community untuk melakukan pengetesan workloads untuk OLTP (Online Transactions Processing) atau OLAP (Online Analytical Processing).
  • Menggunakan tool pengetesan workloads dari aplikasi menggunakan tool seperti HP Load Runner, IBM Rational Performance Tester, Apache JMeter, yang dibangun oleh pemilik aplikasi (karena harus mengetahui logic dari aplikasi untuk pembuatan test plan-nya). Ini adalah mekanisme yang direkomendasikan, tetapi membutuhkan effort yang lebih besar.
  • Melakukan pengetesan via Storage Benchmark Tool – SAN membutuhkan firmware upgrade, host drivers update, re-cabling, dan perubahan lain. Perubahan ini kadang dapat menyebabkan performance issues. Sebaiknya kita membuat I/O baseline terlebih dahulu dengan menggunakan beberapa tools ini :
    • Iometer
    • Linux/UNIX dd
    • Oracle ORION

 

Kind Regards,
Doddi Priyambodo

Key Factors to create Perfect Design for VMware vSphere Infrastructure

If you are doing vSphere Design right now. Please remember this AMPRS rule for your design document.

Always think your design decision based on these key factors. Availability, Manageability, Performance, Recoverability, and Security.

Especially if it is for Business Critical Application, then you MUST consider all these factors.

 

Design Quality Description
Availability Indicates the effect of a design choice on the ability of a technology and the related infrastructure to achieve highly available operation.

Key metrics: percent of uptime.

Manageability Indicates the effect of a design choice on the flexibility of an environment and the ease of operations in its management. Sub-qualities might include scalability and flexibility. Higher ratios are considered better indicators.

Key metrics:

·         Servers per administrator.

·         Clients per IT personnel.

·         Time to deploy new technology.

Performance Indicates the effect of a design choice on the performance of the environment. This does not necessarily reflect the impact on other technologies within the infrastructure.

·         Key metrics:

·         Response time.

·         Throughput.

Recoverability Indicates the effect of a design choice on the ability to recover from an unexpected incident which affects the availability of an environment.

Key metrics:

·         RTO – Recovery time objective.

·         RPO – Recovery point objective.

Security Indicates the ability of a design choice to have a positive or negative impact on overall infrastructure security. Can also indicate whether a quality has an impact on the ability of a business to demonstrate or achieve compliance with certain regulatory policies.

Key metrics:

·         Unauthorized access prevention.

·         Data integrity and confidentiality.

·         Forensic capabilities in case of a compromise.

 

Kind Regards,

Doddi Priyambodo

Kumpulan Session “menarik” di VMworld 2015 San Fransisco

Berikut ini adalah beberapa session yang menurut saya termasuk yang sangat menarik saat session VMworld di San Fransisco kemarin.

Beruntung sekali VMware meng-upload beberapa video dari beberapa session yang ditampilkan disana :

1. vCenter Server Appliance (VCSA) Best Practices & Tips/Trick – by William Lam (http://www.virtuallyghetto.com/)

  • Pembahasan mengenai Enhancement yang ada di VCSA 6U1
  • Proses Instalasi dan Upgrade VCSA 6U1
  • Konfigurasi VCSA 6U1
  • Operations VCSA 6U1
  • Troubleshooting instalasi dan operasional VCSA 6U1
  • Proses Migrasi vCenter 6U1

Check out Youtube videonya disini :


Kind Regards,
Doddi Priyambodo

Bagaimana membuat agile Infrastructure untuk mendukung dunia Aplikasi yang agile

Berikut ini adalah beberapa slide presentasi lama yang saya buat (waktu saya masih kerja di IBM Indonesia), saya simpan di Slideshare (saat ini sudah diakusisisi oleh Linkedin sebesar US$119M!)

Materi dari presentasi ini adalah, untuk kebutuhan Software Development. Saat ini mekanisme untuk pembuatan aplikasi sudah menuju ke tahapan “Dev-Ops”, dimana kecepatan untuk melakukan release ke production dari tahapan development sudah sangat cepat. Sehingga dibutuhkan infrastruktur yang juga agile, tidak hanya metodologi development-nya saja yang agile.

Actually ada beberapa slide yang membutuhkan penjelasan via whiteboarding session, mungkin nanti kalau sempat akan saya jelaskan lebih lanjut di blog ini.

 

Selamat menikmati 🙂

STP may cause temporary loss of network connectivity when a failover or failback event occurs (1003804)

Symptoms

In a switched network environment which uses Spanning Tree Protocol (STP), you experience these symptoms:

  • An ESXi or ESX host temporarily loses network connectivity when a failover or failback event occurs.
  • Virtual machines temporarily lose network connectivity when a failover or failback event occurs.
  • A VMware High Availability (HA) isolation event occurs after one of the teamed NICs of the COS is unplugged and plugged in to a different port.

Resolution

STP is used to accomplish a loop-free environment. Every time a port state goes up, STP calculation occurs. As the result of the calculation, the switch ports are either set to a forwarding or blocking state to prevent a traffic loop. STP topology convergence has four states:

  • Blocking
  • Listening
  • Learning
  • Forwarding

When STP convergence is initiated it forces all of the physical switches in the STP domain to dump their forwarding tables and relearn the STP topology and all MAC addresses. This process can take between 30-50 seconds. During this time, no user data passes through the port. Some user applications can time out during this period. Connectivity is restored when the STP domain completes this convergence.

To prevent the 30-50 second loss of connectivity during STP convergence, perform one of these options:

  • To set STP to Portfast on all switch ports that are connected to network adapters on an ESXi/ESX host
    Portfast allows the ports to immediately be set back to the forwarding state and prevents the link state changes that occur on ESX/ESXi hosts from affecting the STP topology. Setting STP to Portfast prevents the 30-50 second loss of network connectivity.
    The command to set STP to Portfast depends on the model of the switch. As the command is different from model to model and vendor to vendor, c ontact your physical switch vendor for more detailed information on how to configure the same.
    For example:
    To set STP to Portfast on a switch, run the below command based on the switch model:

    • CISCO-IOS
      spanning-tree portfast (for an access port)
      spanning-tree portfast trunk (for a trunk port)
    • NX-IOS
      spanning-tree port type edge (for an access port)
      spanning-tree port type edge trunk (for a trunk port)
    • To set STP to Portfast on a Dell switch, run the command:
      spanning-tree portfast
    • HP switches use a feature called admin-edge-port, which works the same way as Portfast or RSTP.
      To enable admin-edge-port, run the command:
      spanning-tree port-listadmin-edge-port
  • To disable STP
    VMware does not typically recommend that you disable STP. However, to prevent this issue from occurring, it may be necessary to disable STP. Before you disable STP, contact your switch vendor.
    The command to disable STP depends on the switch. Contact your switch vendor for more detailed information.
    For example:
    To disable STP on a Nortel switch, run the command:
    config ethernet stg stp disable

Taken from : http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1003804