Nastavení clusterů HDInsight s vlastní databází Ambari
Apache Ambari zjednodušuje správu a monitorování clusteru Apache Hadoop. Ambari poskytuje snadné použití webového uživatelského rozhraní a rozhraní REST API. Ambari je součástí clusterů HDInsight a používá se k monitorování clusteru a provádění změn konfigurace.
V normálním vytváření clusteru, jak je popsáno v dalších článcích, jako je Nastavení clusterů ve službě HDInsight, se Ambari nasadí ve službě S0 Azure SQL Database , která je spravovaná službou HDInsight a není přístupná uživatelům.
Vlastní funkce databáze Ambari umožňuje nasadit nový cluster a nastavit Ambari v externí databázi, kterou spravujete. Nasazení se provádí pomocí šablony Azure Resource Manageru. Takto funkce má následující výhody:
- Přizpůsobení – zvolíte velikost a kapacitu zpracování databáze. Pokud máte velké clustery zpracovávající úlohy náročné na zpracování, může se stát kritickým bodem pro operace správy databáze Ambari s nižšími specifikacemi.
- Flexibilita – databázi můžete podle potřeby škálovat tak, aby vyhovovala vašim požadavkům.
- Řízení – můžete spravovat zálohy a zabezpečení databáze způsobem, který odpovídá požadavkům vaší organizace.
Zbývající část tohoto článku popisuje následující body:
- požadavky na použití vlastní funkce databáze Ambari
- kroky potřebné ke zřízení clusteru HDInsight pomocí vlastní externí databáze pro Apache Ambari
Požadavky na vlastní databázi Ambari
Vlastní databázi Ambari můžete nasadit se všemi typy a verzemi clusteru. Více clusterů nemůže používat stejnou databázi Ambari.
Vlastní databáze Ambari má následující další požadavky:
- Název databáze nesmí obsahovat pomlčky ani mezery.
- Musíte mít existující server a databázi Azure SQL DB.
- Databáze, kterou zadáte pro instalaci Ambari, musí být prázdná. Ve výchozím schématu dbo by neměly být žádné tabulky.
- Uživatel použitý k připojení k databázi by měl mít oprávnění SELECT, CREATE TABLE, INSERT, UPDATE, DELETE, ALTER ON SCHEMA a REFERENCES ON SCHEMA .
GRANT CREATE TABLE TO newuser;
GRANT INSERT TO newuser;
GRANT SELECT TO newuser;
GRANT UPDATE TO newuser;
GRANT DELETE TO newuser;
GRANT ALTER ON SCHEMA::dbo TO newuser;
GRANT REFERENCES ON SCHEMA::dbo TO newuser;
- Zapněte možnost Povolit přístup ke službám Azure na serveru, na kterém hostujete Ambari.
- IP adresy pro správu ze služby HDInsight musí být povolené v pravidle brány firewall. Seznam IP adres IP, které je potřeba přidat do pravidla brány firewall na úrovni serveru, najdete v tématu IP adresy pro správu SLUŽBY HDInsight.
Při hostování databáze Apache Ambari v externí databázi mějte na paměti následující body:
- Zodpovídáte za dodatečné náklady na databázi Azure SQL, která obsahuje Ambari.
- Pravidelně zálohujte vlastní databázi Ambari. Azure SQL Database generuje zálohy automaticky, ale časový rámec uchovávání záloh se liší. Další informace naleznete v tématu Další informace týkající se automatické zálohy databáze SQL.
- Po dosažení spuštěného stavu clusteru HDInsight neměňte vlastní heslo databáze Ambari. Nepodporuje se.
Nasazení clusterů s vlastní databází Ambari
Pokud chcete vytvořit cluster HDInsight, který používá vlastní externí databázi Ambari, použijte vlastní šablonu rychlého startu pro Ambari DB.
Upravte parametry v azuredeploy.parameters.json
sadě a určete informace o novém clusteru a databázi, která obsahuje Ambari.
Nasazení můžete zahájit pomocí Azure CLI. Nahraďte <RESOURCEGROUPNAME>
skupinou prostředků, do které chcete cluster nasadit.
az deployment group create --name HDInsightAmbariDBDeployment \
--resource-group <RESOURCEGROUPNAME> \
--template-file azuredeploy.json \
--parameters azuredeploy.parameters.json
Upozorňující
Pro váš cluster HDInsight použijte následující doporučený virtuální počítač s databází SQL a hlavním uzlem. Pro žádné produkční prostředí nepoužívejte výchozí databázi Ambari (S0).
Nastavení velikosti databáze a hlavního uzlu
Následující tabulka obsahuje pokyny pro výběr úrovně Azure SQL DB na základě velikosti clusteru HDInsight.
Počet pracovních uzlů | Požadovaná úroveň databáze | Požadovaný virtuální počítač s hlavním uzlem |
---|---|---|
<=4 | S0 | 4 jádra / 28 GB RAM nebo vyšší |
>4 && = <8 | S1 | 4 jádra / 28 GB RAM nebo vyšší |
>8 && = <16 | S2 | 4 jádra / 28 GB RAM nebo vyšší |
>16 && = <32 | S3 | 8 jader/56 GB paměti RAM nebo vyšší |
>32 &&& <=64 | S4 | 8 jader/56 GB paměti RAM nebo vyšší |
>64 && = <128 | P2 | 16 jader / 112 GB RAM nebo vyšší |
>128 | Kontaktujte podporu | Kontaktujte podporu |