top 30 sas interview questions
Lijst met de meest populaire veelgestelde SAS-interviewvragen met antwoorden:
In dit artikel zullen we enkele van de basis- en geavanceerde concepten van SAS-programmeren bekijken aan de hand van de meest gestelde SAS-interviewvragen en antwoorden.
Statistisch analysesysteem, algemeen bekend als SAS, wordt beschouwd als een set van meerdere software die is geïntegreerd en wordt gebruikt voor verschillende bewerkingen, zoals gegevensbeheer, voorspellend - perspectief en beschrijvende analyse, kwaliteitsverbetering, bedrijfsanalyse, applicatieontwikkeling, enz.
Het grote aantal componentenaanpassing van SAS, evenals de uitgebreide programmeeraanpakfunctie samen, voert taken voor gegevensanalyse en gegevenstransformatie uit. Het kan op elk besturingssysteem (Linux, Windows, enz.) Worden uitgevoerd, aangezien het platformonafhankelijk is.
Meest populaire SAS-interviewvragen en antwoorden
Daar gaan we..
Q # 1) Roep de functies op die worden uitgevoerd door SAS.
Antwoord: SAS (Statistical Analysis System) heeft zijn eigen belang in elk bedrijfsdomein.
Hieronder staan enkele van de samengevatte functies die door SAS worden uitgevoerd:
- Gegevensbeheer en projectbeheer
- Data opslagplaats
- Operationeel onderzoek en beslissingsondersteuning
- Informatie opvragen en kwaliteitsmanagement
- Bedrijfsplanning
- Statistische analyse
Q # 2) Wat zijn de 3 componenten in SAS-programmering?
Antwoord: De 3 componenten in SAS-programmering zijn:
- Verklaringen
- Variabelen
- Dataset
V # 3) Maak gebruik van de syntaxisregels die worden gevolgd in SAS-instructies.
Antwoord: SAS-programma is geschreven in Editor-venster. Hier bevat het een reeks instructies gevolgd door de juiste syntaxis in een volgorde voor het SAS-programma om het te begrijpen.
Enkele van de syntaxisregels die worden gevolgd in het geval van de Statement-component van SAS zijn als volgt:
- Het einde van een instructie wordt gemarkeerd door een puntkomma (;).
- Een puntkomma wordt ook gebruikt om meerdere uitspraken te scheiden die op een enkele regel verschijnen.
- SAS-instructies zijn niet hoofdlettergevoelig en hebben extra spaties voordat instructies automatisch worden verwijderd.
- Opmerkingen kunnen op twee verschillende manieren worden opgenomen in het SAS-programma voor verklaringen:
- Een regel die begint met een asterisk (*) en eindigt met een puntkomma (;).
- Een regel die begint met een schuine streep en een asterisk (/ *) en eindigt met een asterisk en een schuine streep (* /).
V # 4) Wat zijn de gegevenstypen die SAS bevat?
Antwoord: ‘Numeriek’ en 'Karakter' zijn de twee soorten gegevenstypen die het SAS-programma bevat.
V # 5) Wat zijn PDV en hun functies?
Antwoord: Program Data Vector (PDV) is een logisch concept en wordt gedefinieerd als een geheugengebied waar een dataset door SAS wordt opgebouwd.
Functies van PDV zijn als volgt:
- Er wordt een database gemaakt met één waarneming tegelijk.
- De invoerbuffer voor het bewaren van de gegevens van een extern bestand wordt gemaakt op het moment van compilatie.
- PDV bevat twee automatische variabelen, namelijk _N_ (geeft het aantal gegevensstap weer dat wordt uitgevoerd) en _ERROR_ (geeft de fout aan die optreedt op het moment van uitvoering).
V # 6) Wat weet u over de SAS-dataset?
Antwoord: SAS-gegevensset wordt in feite de gegevens genoemd die beschikbaar zijn voor analyse binnen een SAS-programma. SAS-gegevensset wordt ook wel de SAS-gegevenstabel genoemd.
SAS-gegevenstabel bestaat uit twee delen:
- Kolommen met variabelen
- Rijen met observaties
Nuttige informatie over de SAS-dataset kan als volgt worden samengevat:
- SAS Dataset kan zowel lezen als het heeft ingebouwde gegevensbronnen voor gebruik zoals Excel, Access, enz.
- De gegevensset die alleen wordt gebruikt in de huidige sessie die wordt uitgevoerd en wordt verwijderd nadat de sessie is beëindigd, wordt tijdelijke gegevensset genoemd.
- De gegevensset die wordt opgeslagen voor gebruik in de toekomstige sessie, wordt ook wel de permanente gegevensset genoemd.
- De ingebouwde dataset is toegankelijk via dit pad Bibliotheken -> Mijn bibliotheken-> SASHELP.
V # 7) Leg uit waarom dubbele trailing @@ wordt gebruikt in Input Statements?
Antwoord: Tijdens het herhalen van gegevensstappen, inclusief dubbele achterstand @@ in Input-instructies, impliceert dat SAS het huidige record moet behouden voor de uitvoering van het volgende Input-statement in plaats van over te schakelen naar het nieuwe record.
V # 8) Leg het verschil uit tussen de NODUP- en NODUPKEY-opties?
Antwoord: Om dubbele waarden uit de tabel te verwijderen, PROC SORT is in principe onderverdeeld in twee opties:
- NODUP
- NODUPKEY
Het verschil tussen deze twee opties is hieronder te zien:
NODUPKEY | NODUP |
---|---|
Vergelijkt alleen de BY-variabele die aanwezig is in de dataset. | Vergelijkt alle variabelen die aanwezig zijn in de dataset. |
Verwijdert dubbele opties voor de waarden van de variabele vermeld in de BY-instructie. | Identificeert en elimineert dubbele waarnemingen. |
Syntaxis: PROC SORT DATA = readin NODUPKEY; BY variabele naam; RENNEN; | Syntaxis: PROC SORT DATA = readin NODUP; BY variabele naam; RENNEN; |
V # 9) Welk commando wordt gebruikt om te sorteren in het SAS-programma?
Antwoord: PROC SORT commando wordt gebruikt voor het uitvoeren van sortering, of het nu gaat om een enkele variabele of meerdere variabelen. Deze opdracht wordt uitgevoerd op de dataset waar de nieuwe dataset is aangemaakt als resultaat van het sorteren, maar de originele dataset blijft ongewijzigd.
Syntaxis:
Waar,
‘Origineel’ verwijst naar de originele dataset
‘Gesorteerd’ verwijst naar het resultaat als gesorteerde gegevensset
‘Variabele’ verwijst naar de kolom waarop de sorteerbewerking wordt uitgevoerd.
Sorteren kan zowel in oplopende als aflopende volgorde.
Om de dataset in aflopende volgorde weer te geven, wordt het trefwoord ‘Descending’ gebruikt in de BY-instructie met de kolomnaam waarop moet worden gesorteerd.
Vraag 10) Leg het verschil uit tussen Informat en Format met een voorbeeld.
Antwoord: Het verschil tussen Informat en Formaat kan worden verklaard als:
Meer te weten komen | Formaat |
---|---|
Geef aan hoe SAS gegevens in de SAS-variabele moet lezen. | Geef aan hoe SAS waarden in de variabele moet weergeven. |
Deze worden gebruikt om de gegevens te lezen of om invoergegevens uit externe bestanden te halen. | Deze worden gebruikt om de gegevens te schrijven. |
V # 11) Maak onderscheid tussen INPUT en INFILE.
Antwoord: Het opnemen van een INFILE-instructie in de SAS-programmering identificeert een extern bestand dat uit de gegevens bestaat, terwijl het opnemen van INPUT-instructie in de SAS-programmering de gebruikte variabelen beschrijft.
De syntaxis voor INFILE:
De syntaxis voor INPUT:
V # 12) Leg het gebruik van PROC-print en PROC-inhoud uit?
Antwoord: De PROC-stap van het SAS-programma wordt gebruikt om ingebouwde procedures op te roepen voor het analyseren van de gegevens van de dataset.
PROC-afdruk: Zorgt ervoor dat de gegevens die aanwezig zijn in de dataset correct worden gelezen.
PROC inhoud: Geeft de informatie over de SAS-gegevensset weer.
V # 13) Leg DATA_NULL_ uit?
Antwoord: Zoals de naam definieert, is DATA_NULL_ een gegevensstap die eigenlijk geen gegevensverzameling creëert.
Je gebruikt het voor:
- Macrovariabelen maken.
- De uitvoer schrijven zonder enige gegevensset.
V # 14) Hoe wordt een tekenvariabele omgezet in een numerieke variabele en vice versa?
Antwoord: Onder SAS-programmering doen zich veel taken voor waarbij een tekenwaarde moet worden geconverteerd naar het numerieke en op dezelfde manier een numerieke waarde moet worden omgezet in een tekenwaarde.
ZETTEN() wordt gebruikt om numeriek naar teken te converteren. In dit geval moeten het bronformaat en het type bronvariabele altijd gelijk zijn.
Voorbeeld:
INPUT () wordt gebruikt om een teken naar numeriek te converteren. In dit geval moet het type bronvariabele altijd tekenvariabelen zijn.
Voorbeeld:
V # 15) Wat is het doel van _CHARACTER_ en _NUMERIC_?
Antwoord: In de huidige dataset,
_KARAKTER_ definieert alle tekenvariabelen die momenteel zijn gedefinieerd.
Voorbeeld Om alle tekenvariabelen in PROC MEANS op te nemen, worden de volgende instructies gebruikt:
_NUMERIC_ definieert alle numerieke variabelen die momenteel zijn gedefinieerd.
Voorbeeld: Om alle numerieke variabelen in PROC MEANS op te nemen, worden de volgende uitspraken gebruikt:
V # 16) Welke commando's worden gebruikt bij het opnemen of uitsluiten van specifieke variabelen in de dataset?
Antwoord: Hiervoor worden DROP-, KEEP- en dataset-opties gebruikt.
De variabele die we uit de gegevensstap willen verwijderen, wordt gespecificeerd in de DROP-instructie.
De variabele die we uit de gegevensstap willen behouden, wordt gespecificeerd in de KEEP-instructie.
V # 17) Maak onderscheid tussen PROC MEANS en PROC SUMMARY.
Antwoord: Het verschil tussen PROC MEANS en PROC SUMMARY kan als volgt worden begrepen:
PROC BETEKENT | PROC SAMENVATTING |
---|---|
Deze procedure produceert standaard het afgedrukte rapport in het OUTPUT-venster. | Deze procedure omvat de PRINT in het overzicht om het afgedrukte rapport te produceren. |
PROC MEANS neemt standaard alle numerieke variabelen in de analyse. | PROC SUMMARY neemt de variabelen in de statistische analyse die worden beschreven in de VAR-instructie. |
Vraag 18) Leg het doel uit van SUBSTR-functies in SAS-programmering.
Antwoord: Bij SAS-programmering wordt de SUBSTR-functie gebruikt in het geval van een tekenvariabele wanneer het programma een vereiste heeft om een substring te abstraheren.
Wanneer een startpositie en lengte zijn opgegeven, wordt deze functie gebruikt voor het abstraheren van tekenreeksen.
Syntaxis: SUBSTR (char_var, start, lengte);
V # 19) Benoem en beschrijf in het kort enkele SAS-karakterfuncties die worden gebruikt voor het opschonen van gegevens.
Antwoord: Enkele SAS-karakterfuncties die worden gebruikt voor het opschonen van gegevens, worden hieronder vermeld:
- Comprimeren (char_string) functie wordt gebruikt voor het verwijderen van spaties of enkele gespecificeerde karakters uit een gegeven string.
- TRIM (str) functie wordt gebruikt voor het verwijderen van volgspaties uit een gegeven string.
- LOWCASE (tekenreeks) functie wordt gebruikt voor het converteren van alle tekens in een bepaalde tekenreeks naar kleine letters.
- UPCASE (tekenreeks) functie wordt gebruikt voor het converteren van alle tekens in een gegeven string naar hoofdletters.
- COMPBL (str) functie wordt gebruikt voor het converteren van meerdere blanco's naar één blanco.
V # 20) Noem enkele manieren waarop een 'table lookup' wordt gedaan in SAS-programmering.
Antwoord: Bij SAS-programmering kunnen de waarden voor het opzoeken van tabellen op de volgende manieren worden opgeslagen:
- Code
- Array
- Hash-object
- Formaat
- Dataset
De volgende technieken worden gebruikt om respectievelijk ‘table lookup’ in SAS uit te voeren:
- SELECT / WHEN of IF / THEN statements
- Array-indexwaarde
- Hash-object sleutelwaarde
- FORMAT-instructie, PUT-functie
- Samenvoegen, samenvoegen, KEY = Optie
Laten we een voorbeeld bekijken dat de ‘Code’ manier laat zien om een tabel op te zoeken door ‘IF / THEN’ instructies te gebruiken:
V # 21) Maak onderscheid tussen de functies PLAFOND en VLOER.
Antwoord: CEIL-functie wordt gebruikt voor het afkappen van numerieke waarden, waarbij de uitvoer wordt weergegeven als het kleinste gehele getal. Met kleinste geheel getal betekent dit dat de gehele waarde groter is dan / gelijk is aan het argument.
Voorbeeld: CEIL (12.85) geeft uitvoer weer als 13.
FLOOR-functie wordt gebruikt voor het afkappen van numerieke waarden waar de uitvoer wordt weergegeven als het grootste gehele getal. Met grootste gehele getal betekent hier dat de gehele waarde kleiner is dan / gelijk is aan het argument.
Voorbeeld: FLOOR (12.85) geeft output weer als 12.
V # 22) Wat zijn de manieren waarop macrovariabelen kunnen worden gemaakt in SAS-programmering?
Antwoord: Welnu, een aantal verschillende technieken kunnen worden gebruikt om macrovariabelen te creëren in SAS-programmering.
Hieronder staan de vijf meest gebruikte methoden vermeld:
- % LET-instructie
- Macroparameters (zowel benoemd als positioneel)
- % DO-instructie (iteratief)
- IN PROC SQL
- ROEP SYMPUTX-routine
Q # 23) Leg het doel van de RETAIN-verklaring uit.
Antwoord: Aangezien de betekenis van het woord ‘RETAIN’ aangeeft dat de waarde behouden moet worden nadat deze is toegewezen, is het doel van de instructie RETAIN hetzelfde in SAS-programmering, zoals de betekenis ervan aangeeft.
Binnen een SAS-programma, wanneer het nodig is om van de huidige iteratie naar de volgende van de gegevensstap te gaan, vertelt de RETAIN-instructie op dat moment aan SAS om de waarden te behouden in plaats van ze als ontbrekend in te stellen.
Voorbeeld: Laten we een programma afdrukken dat de uitvoerwaarde van ‘z’ vanaf 1 weergeeft met behulp van de instructie RETAIN.
V # 24) Welk commando wordt gebruikt om logboeken in het externe bestand op te slaan?
Antwoord: GEDRUKT PROCES commando wordt gebruikt om logboeken in het externe bestand op te slaan.
beste virusverwijdering voor Windows 10
Voorbeeld:
V # 25) Noem enkele veelvoorkomende fouten die gewoonlijk worden gemaakt in SAS-programmering.
Antwoord: Hieronder vindt u enkele van de veelvoorkomende fouten die meestal worden gemaakt, vooral als u nieuw bent met deze programmeertaal.
- De basissyntaxis bevat een puntkomma aan het einde van elke instructie en het missen van een puntkomma is de meest voorkomende fout.
- U slaat het controleren van de logboeken over na het indienen van het programma.
- Commentaarfouten zoals het niet gebruiken van commentaar waar nodig of het op een ongepaste manier gebruiken van commentaar.
- Geen goede foutopsporingsmethoden gebruiken.
V # 26) Noem SAS-systeemopties om SAS-macro's te debuggen.
Antwoord: Om te helpen bij het volgen van zowel de macrocode als de SAS-code die door de macro's wordt gegenereerd, kunnen enkele systeemopties worden gebruikt.
Zij zijn:
- MLOGIC
- MPRINT
- SYMBOLEN
Het bericht dat door deze systeemopties wordt gegenereerd, is te zien in het SAS-logboek.
Vraag 27) Maak onderscheid tussen SAS-functies en SAS-procedures.
Antwoord: De belangrijkste verschillen kunnen worden ontdekt / begrepen aan de hand van de casus die wordt uitgelegd voor zowel SAS-functies als procedures.
Geval:
Voor Functie , wordt de argumentwaarde geleverd of genomen voor berekening over de observatie die wordt genoemd in de programma-instructie, terwijl in het geval van Procedure , wordt van elke waarneming verwacht dat deze slechts één variabele heeft waarmee de berekening wordt uitgevoerd, zoals vermeld in het onderstaande voorbeeld.
Laten we het begrijpen met voorbeelden:
Hier in de bovenstaande voorbeelden worden de argumenten die aan de gemiddelde functie zijn doorgegeven, als observatie genomen voor berekening.
Hier in het bovenstaande voorbeeld betekent Proc dat de functie de gemiddelde temperatuur berekent voor één argument dat als observatie wordt doorgegeven, d.w.z. per maand.
Q # 28) Wat weet u over SYMPUT en SYMGET?
Antwoord: De belangrijkste verschillen tussen de twee worden hieronder vermeld.
SYMPUT wordt gebruikt voor het opslaan van de waarde van een gegevensset in de macrovariabele, terwijl SYMGET wordt gebruikt voor het ophalen van de waarde van de macrovariabele naar de gegevensset.
Q # 29) Leg de speciale invoerscheidingstekens uit die worden gebruikt bij SAS-programmering.
Antwoord: De speciale invoerscheidingstekens die worden gebruikt bij SAS-programmering zijn:
- DLM
- DSD
Ze worden gebruikt in de instructie ‘INFILE’ en DSD heeft de functionaliteit om de scheidingstekens tussen aanhalingstekens te negeren.
Q # 30) Welke functie wordt gebruikt om het aantal intervallen tussen twee SAS-datums te tellen?
Antwoord: Intervalfunctie INTCK wordt gebruikt voor het tellen van het aantal intervallen tussen twee gegeven SAS-datums.
Syntaxis:
Gevolgtrekking
Tot nu toe hebben we meerdere vragen en antwoorden gezien die u een duidelijk begrip zouden hebben gegeven van SAS-programmeerconcepten en u ook een idee zouden hebben gegeven van de aard van de vragen die in SAS-interviews worden gesteld.
Welnu, als u nieuw bent met SAS-programmeren, zal de kennis van sommige technologieën van computerprogrammering en bekendheid met SQL (Structured Query Language) een extra voordeel voor u zijn om SAS te begrijpen en snel te leren.
Hoop, je bent klaar om elk SAS-interview met vertrouwen tegemoet te treden !!