[ΠigData Π’eam] ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero (2023)
[ΠigData Π’eam] ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero (2023)
ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero [bigdata team]
ΠΠ° ΠΏΡΠΎΡΡΠΆΠ΅Π½ΠΈΠΈ ΡΡΠΎΠΉ ΡΠ°ΡΡΠΈ ΠΊΡΡΡΠ° Π²Ρ Π±ΡΠ΄Π΅ΡΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΎ Spark: ΠΎΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² ΠΈ RDD Π΄ΠΎ Spark DataFrames ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ Spark Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
cΡ Π΅ΠΌΠ° Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ Π² Spark;
ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ Spark (job, task, stage);
ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ Π² Π²ΠΈΠ΄Π΅ Π³ΡΠ°ΡΠ°. Spark Python API. Spark RDD API;
Broadcast-ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ ΠΈ ΡΡΠ΅ΡΡΠΈΠΊΠΈ.
Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΠ΅ Hive ΠΈ Spark SQL;
ΠΎΡΠ»ΠΈΡΠΈΡ DF ΠΎΡ RDD.
Spark on YARN;
ΡΠΈΠΏΡ stage Π² Spark;
ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ shuffle;
Π½Π°ΡΡΡΠΎΠΉΠΊΠ° Garbage Collection, ΡΡΠ½ΠΈΠ½Π³ ΠΏΠΎΡΡΠ΅Π±Π»Π΅Π½ΠΈΡ ΠΏΠ°ΠΌΡΡΠΈ.
ΠΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΊΡΡΡ ΠΏΠΎ Big Data. Π§Π°ΡΡΡ 2. Spark: from zero to hero [bigdata team]
ΠΠ° ΠΏΡΠΎΡΡΠΆΠ΅Π½ΠΈΠΈ ΡΡΠΎΠΉ ΡΠ°ΡΡΠΈ ΠΊΡΡΡΠ° Π²Ρ Π±ΡΠ΄Π΅ΡΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΎ Spark: ΠΎΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² ΠΈ RDD Π΄ΠΎ Spark DataFrames ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ Spark Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ.
Π ΡΡΠΎΠΌ ΠΌΠΎΠ΄ΡΠ»Π΅ Π²Ρ ΠΈΠ·ΡΡΠΈΡΠ΅:
cΡ Π΅ΠΌΠ° Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ Π² Spark;
ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ΅ΡΠΌΠΈΠ½Ρ Spark (job, task, stage);
ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ Π² Π²ΠΈΠ΄Π΅ Π³ΡΠ°ΡΠ°. Spark Python API. Spark RDD API;
Broadcast-ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΡ ΠΈ ΡΡΠ΅ΡΡΠΈΠΊΠΈ.
Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΠ΅ Hive ΠΈ Spark SQL;
ΠΎΡΠ»ΠΈΡΠΈΡ DF ΠΎΡ RDD.
Spark on YARN;
ΡΠΈΠΏΡ stage Π² Spark;
ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ shuffle;
Π½Π°ΡΡΡΠΎΠΉΠΊΠ° Garbage Collection, ΡΡΠ½ΠΈΠ½Π³ ΠΏΠΎΡΡΠ΅Π±Π»Π΅Π½ΠΈΡ ΠΏΠ°ΠΌΡΡΠΈ.
favorite
0
star
0
